# ------------------------------------------------------------------ # Frågor om filformat # ------------------------------------------------------------------ # Vad är det här för slags filer? # ------------------------------------------------------------------ # Filerna måste packas upp. tgz-filer är så kallade tar-filer (Tape/ARchive) som är komprimerade med gzip (GNU-zip). Detta filformat och denna komprimeringsalgoritm är standard inom unix-världen. Numera kan de flesta (alla?) zipverktyg hantera (packa upp på ett intelligent sätt) tgz-filer. zip-filer är material komprimerade och förpackade med ett förfarande som i allt väsentligt överensstämmer med pkzip vilket är det normala i Windows-världen. Separata verktyg för hantering av tgz- eller zipfiler följer inte med i äldre Windows- eller Macintosh-distributioner men kan hämtas från: http://www.winzip.com/ (för windows) http://www.stuffit.com/ (för mac) Under förutsättning att man besitter elementära kunskaper om nedladdning och installation av programvara är proceduren för dessa program så enkel den kan bli. Enda undantaget är om man saknar rättigheter att installera programvara på sin maskin - man blir då tvungen att vända sig till sin systemperson. Användningen är sedan i stort sett transparent. # ------------------------------------------------------------------ # Men vilket program ska användas för att ÖPPNA de uppackade filerna? # ------------------------------------------------------------------ # Vid såna här frågor behöver rådgivaren egentligen alltid veta vilken datorplattform (Mac, Windows, ...?), vilken operativssystemsversion (MacOS X,Windows XP, ...) och i ifrågavarande fall också vilken texteditor som skall användas. Innehållet i tarfilerna är ett antal vanliga textfiler, som kan beses med t.ex. något av följande * texteditor (se nedan) * ordbehandlare (som StarOffice el. MsWord) * kalkylprogram (som StarOffice el. MsExcel). En av anledningarna till att materialet inte ligger öppet på webben är att filerna är relativt stora (de största ca. 4 Mb) vilket kan leda till kapacitetsproblem för användare med långsamma uppkopplingar eller orkeslösa datorer. Storleken spelar in även map. vilket program som kan öppna filerna. I vissa (äldre) versioner av windows klarar inte systemets texteditor "Notepad" ("Anteckningar") att öppna större filer än 80 Kb. MsWord går också ganska trögt vid denna filstorlek. # ------------------------------------------------------------------ # # Öppna filerna i en texteditor (rekommenderas) # ------------------------------------------------------------------ # För att använda en editor: De flesta editorer för Windows och macmiljö är ganska väl integrerade med hur operativsystemet hanterar filer. Alltså - använd arkivmenyn och dess "öppna" -alternativ. Om du inte använder någon editor: börja genast göra detta! Notepad ("Anteckningar") i Windows och "Skriv Text" i Mac-miljö, är två sådana elementära texteditorer. Windowsmiljö : Notepad kan inte rekommenderas. EmEditor från Emurasoft (http://www.emurasoft.com/, gratis för akademiskt bruk) är ett bättre alternativ. MacIntosh: BBEdit rekommenderas (http://www.barebones.com). # ------------------------------------------------------------------ # # Öppna filerna i Excel # ------------------------------------------------------------------ # I Excel kan innehållet delas upp i olika kolumner vilket möjliggör smidig beräkning av delfrekvenser och sortering på olika sätt.. Excelimport underlättas om man vet hur den importerade filen ser ut Alltså: själva frekvensmaterialet ser ut så här: först några rader med licensinformation ("lagtext") som börjar och slutar med raden: # --------------------------------------------------------- # sedan för alla ord i filen - rad för rad - ett eller flera (tabbseparerade) fält med frekvensinformation följt av tabbtecken följt av ordet. Exempel: 570041 och 544542 i 458872 att 385642 det 333312 som --- OSV Den juridiska texten klipper man bort. Sedan importeras texten med lämpligt filter (tabb-separerade poster) till ett nytt kalkylark . # ------------------------------------------------------------------ # # för att använda MsWord: # ------------------------------------------------------------------ # öppna filen genom att starta word först och genom att med words filhanteringsmaskineri öppna filen. Du kommer då att få välja mellan olika textformat och det finns flera som fungerar.