Kuka?

Pandoc muuntaa tekstin

Moni meistä kirjoittaa ja tallentaa tekstin puhtaana tekstinä, Markdownina tai esimerkiksi Emacsin Org mode -muodossa.

Usein teksti kuitenkin tarvitaan käyttöön esimerkiksi muunnettuna HTML:ksi, PDF:ksi tai vaikkapa Microsoft Wordin DOCX-muodoksi.

Nopeimmin teksti siirtyy muodosta toiseen komentoriviohjelmalla Pandoc.

Pandoc on dokumentinmuuntaja, jonka avulla esimerkiksi Markdown-tiedosto kääntyy HTML:ksi näin yksinkertaisella komennolla:


pandoc teksti.md -o teksti.html

Samanlainen yksinkertainen komento muuttaa puhtaan tekstitiedoston Wordin DOCX-muotoon:


pandoc teksti.txt -o teksti.docx

Ja samalla tavoin Markdown muuttuu e-kirjoissa paljon käytettyyn EPUB-muotoon:


pandoc teksti.md -o teksti.epub

Pandoc päättelee tiedostopäätteiden perusteella, minkälaisesta tiedostosta on kyse ja minkälaiseen formaattiin tiedosto pitää muuttaa. Yhdysvaltalaisen filosofian professorin John MacFarlanen koodaama Pandoc tuntee useita Markdown-muotoilukielen versioita, ja käännettävät tiedostot voivat sisältää myös alaviitteitä, taulukoita, sisällysluettelon ja niin edelleen.

Parhaiten Pandoc tukee juuri Markdownia, mutta ohjelma ymmärtää lavean valikoiman muitakin muotoilukieliä.

Tekstin muuttaminen tiedejulkaisujen käyttämään LaTeX-formaattiin edellyttää, että koneelle on asennettu Pandocin lisäksi myös LaTeX. LaTeXia tarvitaan myös tekstin konvertointiin PDF-tiedostoksi.

Pandoc tarjoaa monenlaisia valitsimia tiedoston tarkempaan säätämiseen ja käyttäjä voi luoda myös dokumenttipohjan kohdetiedoston malliksi. Pandocin sivuilta löytyy opas ohjelman käytöstä ja monenlaisia käytännön esimerkkejä. Pandocin saa asennettua niin Macciin, Linuxiin kuin Windowsiin.