Filer

3 Februar 2015

Kva er egentlig ei fil?

Data er logisk representert ved nullarar og einarar på ein datamaskin. Ei bestemt og avgrensa mengde data kallar vi for ei fil, og vi gir disse gruppene eit filnavn. Fysisk er data representert ved mønster i minnet, på harddisken eller eit anna lagringsmedium, og ofte er innhaldet i ei fil spredd på ulike plasser på datamaskinen. Så korleis kan datamaskinen vita kva data som høyrer til i ei bestemt fil? Og korleis kan den vita kor det er ledig plass, der den kan lagra enten nye, eller utvida eksisterande filer? Og korleis kan den vita kva data som er sletta?

FAT

Dette er filsystemet si oppgave. Det fins mange ulike typar filsystem, men FAT-systemet kan tena som et eksempel. Harddisken blir delt opp i cluster. Eit cluster er den minste delen av disken som kan adresserast. Ei stor fil kan då bli plassert i mange cluster som ikkje nødvendigvis heng saman. Kvart filnavn refererer då til ei bestemt adresse (dvs den fysiske staden på disken) for det clusteret som inneheld første delen av fila. For å finna resten av fila har systemet ein tabell kalla File Allocation Table (og derav navnet FAT). Når maskinen slår opp i denne tabellen med adressa til eit bestemt cluster finn vi adressa til det neste clusteret der fila fortset. Men hvis dette er siste bit av fila, inneheld tabellen i staden eit end of cluster-chain (EOC) tegn. Ledige cluster har 0 i tabellen, mens ødelagte cluster blir merka med et spesielt tegn.

Mapper

Vi bruker mapper / katalogar til å gruppera filer som er relatert  til kvarandre. Men kva er ei mappe? Og korleis veit datamaskinen kva filer som er i ei mappe, og kor den skal finna dei? I FAT-systemet er mappene rett og slett filer som inneheld tabellar. Disse tabellane inneheld filnavn og adresse i tillegg til diverse annan informasjon som størrelse og når fila er oppretta. Tabellane kan også innehalda andre mapper, sidan det jo bare er ein spesiell type fil. Det er disse tabellane program som filutforskaren i windows (som egentlig heiter explorer.exe)  brukar til å visa mappestrukturen slik at du kan flyta, renama, sletta filer, og laga nye mapper mm. Utforskaren er ikkje ein del av sjølve filsystemet, og det fins mange alternativ til dette programmet.

Sletting og gjenoppretting

Merk at ved denne måten å oragnisera data på blir ikkje filer fysisk sletta når du trykkjer slett. Det som skjer er at alle dei clustera som fila låg i blir markert som ledige i FAT-tabellen, men data blir liggjande. Dette utgjer ein risiko, fordi uvedkommande då ganske lett kan få tak i data du trudde var borte. For at data skal bli fysisk sletta, må vi overskriva data (med null, eller tull). Dette kallast wiping. Det fins mange verktøy for å gjera dette. Eit av dei er CCleaner, som er nyttig til andre ting også. For å vera sikker på at ingen skal kunnagjenskapa data bør du gjera dette minst tre gonger, seier ekspertar. Grunnen til det er at det kan finnast spor etter tidligare data på disken. Men somme seier at det einaste sikre er å fysisk ødeleggja disken! Men folk flest er meir opptatt av å ikkje sletta ved feil. Og det gode med at data ikkje blir sletta fysisk er at det ofte er mulig å gjenskapa data hvis du har sletta filer ved ein mistak eller fått feil på disken mm. Det kan vera mange grunnar til at data går tapt, alt frå ødelagt hardware til systemfeil som rot i filsystemet. Også her fins det verktøy som kan hjelpa.

Fragmentering

Etter kvart som ein bruker datamaskinen, så forandrar ein heile tida på filinnhaldet. Noken filer blir lagt til og noken sletta, mens andre blir endra på. Så lenge det er god plass på disken kan alle filene ligga etter kvarandre og henga saman. Men når ei fil blir større enn det det er ledig plass til rett etter, så må jo resten leggjast ein annan plass. Etter ei stund vil dermed fleire og fleire av filene bli spredt. Dette kallast fragmentering, og vil gå ut over datamaskinens ytelse fordi det tar meir tid å finna data. For å overkomma dette går det an å rydda på disken ved å flytta fragment slik at filene heng mest mulig saman fysisk. Dette kallast for defragmentering. Her fins det også mange verktøy. I dag er dette eit mindre problem enn før fordi diskane blir både større og raskare. I har nyare operativsystem automatisk defragmentering innebygd.

Formater og filtyper

Data må tolkast for at vi og programma våre skal kunna forstå dei. Datamaskinen må derfor kjenna formatet på filene. Formatet er dei reglane som fortel kva nullarane og einarane skal bety. Derfor inneheld filene ofte disse reglane i begynnelsen av file, som ein header, før data kjem. Filtypen, eller ekstensjonen (etternavnet) er knytta til formatet. Wordfiler heiter .doc eller liknande osv. Men dette er for å kunna opna disse filene med riktig program. Filer som har feil format kan det henda at word ikkje klarer å opna. Hvis du bruker word som skriveprogram, så blir .doc-filene opna i Word automatisk når du dobbeltklikker. Men dette kan du endra på. Hvis du heller vil bruka OpenOffice, så endrar du tilknytning. Tilsvarande er det mulig å endra filekstensjonen. Då må du først be filutforskaren å visa filtype, og så kan du endra den som ein del av navnet, noko den jo også er. Hvis du endrar eit word-dokument til .tullefil (Før måtte filtypane vera på bare tre tegn) så kan du fremdeles opna det i Word, men ikkje ved å dobbeltklikka det. For at brukarar ikkje skal endra filtype uforvarande har windows som default at filtypen ikkje skal visast. Men det kan vera risikabelt på ein annan måte, sidan eit skadelig program kan lata som om det td. er ei tekstfil. Ei fil som heiter "viktig.txt.exe" er egentlig ei kjørbar fil, dvs. eit program. Hvis du bare ser første del "viktig.txt", kan du tru at det bare er ei tekstfil. Men hvis du dobbeltklikker det, vil du starta programmet.