Tiedostomuoto
Wikipedia
Tiedostomuoto ilmaisee tietokoneiden tallennusmedialle talletetun tiedoston mediatyypin eli rakenteen. Monista tiedostomuodoista on olemassa julkinen määritelmä, jossa kuvataan miten tieto tulee koodata. Hyötynä on talletetun tiedon yhteensopivuus eri ohjelmien ja järjestelmien välillä.
Tiedostomuodon tunnistamiseen on kehitetty useita eri tapoja. Eräs yleisesti käytetty tapa on käyttää tiedostopäätteitä. Tiedostonhallintaohjelmat, kuten esimerkiksi Windows-käyttöjärjestelmä tai KDE:n tiedostoselain Konqueror käyttävät tiedostopäätettä päätellääkseen tiedoston tiedostotyypin, mikä on jokaiselle tiedostomuodolle määritelty. Tiedostopääte on tiedoston nimessä viimeisen pisteen jälkeen tulevat merkit. Esimerkiksi HTML-dokumentit tunnistetaan .html tiedostopäätteestä. Muita tiedostomuodon tunnistamiseen käytettäviä tapoja on muun muassa tiedostomuodon tunnisteen tallentaminen tiedostoon ja metadatan tallentaminen tiedostojärjestelmään.
Tiedostopäätteet näkyvät tiedostonimen loppuosassa pisteellä eroteltuna. Esimerkiksi tiedostonimessä foobar.txt txt ilmaisee tiedostopäätteen tarkoittaman määrämuotoisen tiedostotyypin olevan (yksinkertainen) tekstitiedosto, minkä voi avata millä tahansa .txt-tiedostotyyppisiä tekstitiedostoja lukevalla tekstinkäsittelyohjelmalla, vaikka Windowsin Muistiolla, Nota Benellä, AbiWordilla jne. Mikäli tiedostotyyppi olisi .rtf, olisi tiedoston nimi foobar.rtf ja se tarkoittaisi tekstimerkkistä tiedostoa kehittyneempää, rikastettua tekstitiedostoa, joka voi sisältää tekstin lisäksi yleisiä tekstimuotoiluja kuten esimerkiksi lihavointia. Jos tiedostotyyppi olisi .doc, olisi tiedoston nimi foobar.doc, mikä tarkoittaisi yleistä – Microsoft Wordin käyttämää – tekstitiedostomotoa, jota osaavat tulkita myös monet muut nykyaikaiset tekstinkäsittelyohjelmat.
Toinen tapa ilmaista tiedostomuoto on MIME-tyypit. Ne ovat hallitseva tapa kuvata tiedostomuotoja Internetissä. MIME-muodot koostuvat standardoiduista tunnisteista, jossa tyyppi ja alatyyppi erotetaan kauttaviivalla – esimerkiksi text/html tai image/gif. MIME-tyypit oli tarkoitetu alun perin kuvaamaan sähköpostin liitetiedostojen tiedostomuotoja alustariippumattomasti.
Erityisesti UNIX-järjestelmiin ja sen jälkeläisiin yhdistetty tapa on aloittaa tiedosto jollain binäärisarjalla. Esimerkiksi GIF-tiedostot alkavat tekstien GIF87a tai GIF89a ASCII-muodon binäärisarjoilla standardista riippuen. Tämä tapa ei kuitenkaan ole kätevä, jos pitää selvittää usean tiedoston tiedostomuoto, koska jokaisesta tiedostosta pitää lukea alku ja arvata siitä sen tyyppi.
Myös muita tapoja kertoa tiedoston tiedostomuoto löytyy esimerkiksi Mac OS-käyttöjärjestelmästä.
[muokkaa] Tiedostomuotoja
Tiedostomuotoja on olemassa useita eri tarkoituksiin. Joihinkin tarkoituksiin on jopa useita kilpailevia muotoja. Osa tiedostomuodoista on suunniteltu vain yhtä tarkoitusta varten, kuten JPEG staattisten kuvien tallennusta varten. Osaa tiedostomuodoista voidaan käyttää useaan tarkoitukseen, kuten GIF-tiedostomuoto jota voidaan käyttää kuvien ja animaatioiden tallentamiseen. Tiedostomuodot voidaan jakaa käyttötarkoituksensa perusteella seuraavasti:
[muokkaa] Arkistotiedostomuodot
Arkistotiedostomuodot tiivistävät alkuperäisiä tiedostoja ja arkistoimalla säästetään muistitilaa tai pystytään siirtämään tiedostoja verkostossa vähäsemmällä määrällä tietoliikennettä.
- .dmg, 7z, ACE, ARJ, Ar, Autopackage, Cabinet (tiedostomuoto), DGCA, Deb, Delta encoding, EAR (tiedostomuoto), GCA, gzip, ISO (kuva), Jar, LHA, LZX, .MPQ, Par file, RPM (tiedostomuoto), Shar, Solid compression, Stufflt, Tar, Uharc, WAR (tiedostomuoto), ZIP, Zoo
[muokkaa] CAD-tiedostomuodot
CAD-tiedostomuodot, mitä käytetään tietokoneavusteisen suunnittelun tiedostomuotoina kehittyneissä suunnittelu- ja piirto-ohjelmissa.
[muokkaa] Kuvatiedostomuodot
Kuvatiedostomuotoja käytetään kuvien tallentamiseen, säilyttämiseen ja katseluun. Kuvat voidaan jakaa bittisyvyytensä mukaan määrittyviin värisyvyyksiin.
[muokkaa] 8-bittiset kuvatiedostomuodot
8-bittisten kuvatiedostomuotojen värisyvyys on 256 väriä (28). 256 väriä riittää mustavalkoisiin harmaasävykuviin tai 24-bittisten kuvien paletista poimittuihin 256 värisiin yksinkertaisiin värikuviin, esimerkiksi sarjakuviin tai piirroksiin. Mikrotietokoneiden VGA-näyttökortit pystyivät toistamaan 8-bittistä tietokonegrafiikkaa. Viimeksi VGA-tasoista grafiikkaa on ollut kameralla varustetuissa matkapuhelimissa 256 värillä on ollut 2000-luvun alkupuolella.
Näihin tiedostomuotoihin kuuluvat mm.
- BMP, kehittäjä Microsoft Windows bitmap, pakkaamaton tiedostomuoto
- GIF,kehittäjä/patentin haltija Unisys/IBM
[muokkaa] 16-bittiset kuvatiedostomuodot
16-bittisten kuvatiedostomuotojen värisyvyys (High Color) on 65 536 väriä (216). RGB-järjestelmässä 16-bitin värisyvyydessä punainen osoitetaan viidellä bitillä, sininen viidellä bitillä, mutta vihreä kuudella bitillä. Mikrotietokoneiden XGA-näyttökortit pystyivät toistamaan 16-bittistä tietokonegrafiikkaa.
High Coloriin 16-bittisen järjestelmän lisäksi kuuluu 15-bitin järjestelmä, missä vihreäkin toistetaan viidellä bitillä ja mikä tuottaa vain 32 768 (215) värin syvyyden.
[muokkaa] 24-bittiset kuvatiedostomuodot
24-bittisten kuvatiedostomuotojen värisyvyys (True Color) on 16 777 216 väriä (224), mihin yleensä viitataan 16 miljoonana värinä. True Colorissa RGB-järjestelmässä sekä vihreä että punainen ja sininen tuotetaan kahdeksalla bitillä. Mikrotietokoneiden SVGA-näyttökortit pystyvät toistamaan 24-bittistä tietokonegrafiikkaa.
True Color tarkoittaa täysiväristä (aitoväristä), koska ihmissilmä havaitsee yleensä vain runsaat 10 miljoonaa väriä. Näin ollen pelkkään katseluun 24-bittinen värisyvyys on usein riittävä.
Mikäli kuvaa aiotaan työstää myöhemmin osittain tai kokonaan, voi kuvan tallettaminen suuremmalla värisyvyydellä olla tarkoituksenmukaista, vaikka se vie enemmän muistitilaa kuin 24-bittisenä tallentaminen.
- JPEG, kehittäjä Joint Photographic Experts Group [1]
- JPEG:n ominaisuuksiin liittyy tilaa säästävä häviöllinen pakkausmuunnos: diskreetti kosinimuunnos (DCT), kvantifiointi (kuvatiedostopakkaus) ja Huffmanin koodaus.
- PCD, omistaja Kodak
- häviöllinen pakkausmuunnos
32-bittisten kuvatiedostomuotojen värisyvyys ei ole 4 294 967 296 väriä, vaan 32-bittinen kuvatiedostomuoto perustuu 24-bittisille värisyvyyksille, missä lopuilla 16 bitillä 24-bittistä värisyvyyttä (16 777 216 väriä) täydennetään alfakanavan värisävyillä. 32-bittinen värisyvyys tuli käyttöön tietokoneiden kehityttyä 16-bittisistä 32-bittisiksi.
[muokkaa] 48-bittiset kuvatiedostomuodot
48-bittisten kuvatiedostomuotojen värisyvyys on yli 281 biljoonaa, 281 474 976 710 656 (248), väriä. Tämän lisäksi PNG tulee 16-bittisesti alfakanavaa. PNG liittyy GIFin 2003 rauenneeseen patenttiin ja se on vapaata lähdekoodia. PNG:tä käytetään mm. Wikipediassa.
- PNG, vapaa W3C-standardi, uusi versio ISO/IEC 15948:2003
- häviötön deflate-pakkausmuunnos
- Microsoft Internet Explorerit eivät tue PNG-formaatin kaikkia ominaisuuksia täysin. Internet Explorer 7 -selaimeen on luvattu tuki PNG-kuville.
[muokkaa] Muita tiedostomuotoja
[muokkaa] Digitaalikameroiden tiedostomuoto
RAW -tiedostomuodot ovat digitaalikameroiden muokkaamattomien raakuvien tiedostomuotoja, mitkä digitaalikamera tallentaa sellaisenaan käsittelemättöminä.
Raakakuvista on olemassa eri tiedostomuotoja tai niiden versioita kameranvalmistajasta riippuen eivätkä RAW:t muodosta yhtenäistä standardia tai yhtenäisiä standardeja kehitysvaiheensa mukaan valmistajien kesken.
Useimmissa digitaalikameroissa voi tallentaa myös TIFF- tai JPEG-tiedostomuotoisina niiden käsittelemiseksi yleisesti käytössä olevilla kuvankäsittelyohjelmilla. Eri kameranvalmistajien RAW-tiedostomuodoissa on eroja. Kuvan muuttaminen TIFF- tai JPEG-muotoon voi hävittää kuvan informaation määrää, esimerkiksi värien syvyyttä.
[muokkaa] Vektorigrafiikan tiedostomuoto
[muokkaa] Sivuntaitto-ohjelmien tiedostomuoto
[muokkaa] WAP-matkapuhelinten tiedostomuoto
[muokkaa] Tekstitiedostomuodot
Tekstitiedostomuodot, mitä käytetään tekstien tallentamiseen ja esittämiseen yksinkertaisimmasta ja varhaisimmasta monipuolisimpaan lueteltuna.
- TXT, tekstimerkkitiedosto
- RTF, rikastettu tekstimerkkitiedosto
- DOC, Microsoft Wordin tiedostomuoto, käytetään myös monissa muissa tekstinkäsittelyohjelmissa
[muokkaa] Äänitiedostomuodot
Äänitiedostomuotoja käytetään äänen tallentamiseen, säilyttämiseen ja toistamiseen.
[muokkaa] Häviötön pakkaus
[muokkaa] Häviöllinen pakkaus
[muokkaa] Lista tiedostomuodoista
[muokkaa] Ääni
- .3gp
- .aac
- .aif tai .aiff
- .au
- .flac tai .fla
- .m4a (MPEG-4)
- .mp3
- .mp2
- .ogg
- .ra (Real Audio)
- .wma
- .wav
[muokkaa] Kuva (still)
[muokkaa] Kuva (liikkuva)
- .3gp
- .asf (Windows Media-kirjekuori)
- .avi ("kirjekuori" useille formaateille)
- .flv (Flash Video)
- .gif (animoitua kuvaa)
- .m4v (suosittu video-podcasteissa)
- .mng (liikkuvaa PNG-kuvaa)
- .mpeg/.mpg (MPEG-2)
- .mp4 (MPEG-4)
- .mov (Quicktime)
- .mkv (Matroska)
- .ogm (kuten .avi, käytetty Ogg Vorbis-pakkausta)
- .rm (Real Media)
- .wmv (Windows Media Video-kirjekuori)
[muokkaa] Liikkuvaan kuvaan kuuluva tekstitys
- .srt (SubRip-muotoinen videotekstitys)
- .ssa (SubStation Alpha-muotoinen videotekstitys)
- .sub
[muokkaa] Pakatut
- .7z (7-Zip)
- .ace
- .arj
- .bz2 (bzip2)
- .cab (Microsoft Cabinet)
- .gz
- .jar
- .lhz (LHA)
- .rar
- .sit
- .tar
- .zip
- .zoo
[muokkaa] Levyimaget
- .nrg (Nero)
- .iso
- .mdf (Media Descriptor File, yhdessä *.mds:n kanssa)
- .cue (yhdessä *.iso:n tai *.bin:n kanssa)
- .dmg
- .img
[muokkaa] Ohjelmointi
- .adb (Ada)
- .ads (Ada)
- .c (C-lähdekoodi)
- .cb ( Coolbasic )
- .cc (Yleinen C++)
- .class (Javan tavukoodi (käännetty))
- .cpp (Yleinen C++)
- .dcu (Delphi)
- .dcr (Shockwave-multimedia)
- .dem (maskitiedosto Delphi ja Lazarus)
- .dfm (Delphi)
- .dll
- .dpr (Delphi)
- .f (Fortran, yleensä Fortran 77)
- .f90 (Fortran 90)
- .f95 (Fortran 95)
- .h (Yleinen C,C++)
- .hh (C++)
- .java (Javan lähdekoodi))
- .lds (Lazarus)
- .lfm (Lazarus)
- .lpi (Lazarus)
- .lrs (Lazarus)
- .o (Yleinen käännetty kirjasto C,C++, Pascal)
- .p (Pascal)
- .pas (Yleinen Pascal mm. Delphi, Free Pascal, Lazarus)
- .php (PHP)
- .phpn n:n tilalla joskus versionumero kertomassa mille php:n versiolle tehty
- .pl (perl)
- .py (Python)
- .pyc (Pythonin tavukoodi)
- .pyo (optimoitu Pythonin tavukoodi)
- .pyw (Windowsissa ilman konsolia suoritettava Pythonin tavukoodi)
- .pp (Free Pascal, Lazarus)
[muokkaa] Toimisto-ohjelmat
[muokkaa] Tekstinkäsittelyohjelmat
- .doc Word
- .odt OpenDocument Text
- .rtf (Rich text Format)
- .txt
- .pages (Pages)
[muokkaa] Taulukkolaskentaohjelmat
- .xls Excel
- .sxc OpenOffice.org Calc
- .ods OpenDocument Spreadsheet
[muokkaa] Esitysgrafiikkaohjelmat
- .ppt (PowerPoint)
- .pot (PowerPoint)
- .odp (OpenOffice)
- .key (Keynote)
[muokkaa] Sivuntaitto- ja julkaisuohjelmat
- .eps (Encapsulated PostScript)
- .mcv
- .pdf (Adoben luoma, yhdistää grafiikan ja tekstin)
- .ps PostScript
- .sla Scribus
- .tex TeX, LaTeX
[muokkaa] Muut
- .asc
- .bat (MS-DOS -komentorivitiedosto)
- .com
- .exe
- .html
- .shtml
- .xhtml
- .qrp
- .rpm (RPM Package Manager)
- .rpt
- .sav
- .sh (Unix tai Linux -komentorivitiedosto)
- .csh
- .torrent BitTorrent
[muokkaa] MIME-tyypit
Linux-tietokoneissa on yleensä tiedosto /etc/mime.types, jossa luetellaan tiedostopäätteet ja niitä vastaavat tietotyypit (MIME-tyyppi, RFC 2045, RFC 2046).
[muokkaa] Aiheesta muualla
[muokkaa] Katso myös
[muokkaa] Aiheesta muualla
- Tiedostomuodot (englanniksi)
- File extensions encyclopedia (englanniksi)
- Wotsit (englanniksi)
- http://www.fileinfo.net (englanniksi)