{"id":298,"date":"2023-11-27T13:15:00","date_gmt":"2023-11-27T13:15:00","guid":{"rendered":"https:\/\/staging.arkiwera.se\/wp\/?p=298"},"modified":"2025-02-20T21:40:11","modified_gmt":"2025-02-20T20:40:11","slug":"en-introduktion-till-filformatet-warc","status":"publish","type":"post","link":"https:\/\/staging.arkiwera.se\/wp\/en-introduktion-till-filformatet-warc\/","title":{"rendered":"En introduktion till filformatet WARC"},"content":{"rendered":"\n<p><em>Kanske har du h\u00f6rt begreppet WARC n\u00e4mnas i samband med webbarkivering och undrat vad det egentligen \u00e4r? Eller har du noterat i Arkiwera att det sedan i somras g\u00e5r att bevara sina webbplatser och sociala medier i WARC-formatet? I denna artikel ber\u00e4ttar vi kort om detta format som \u00e4r skapat just f\u00f6r att lagra arkiverade webbplatser och sociala medier.<\/em><\/p>\n\n\n\n<p>WARC st\u00e5r f\u00f6r <em>Web ARChive<\/em> och \u00e4r ett filformat f\u00f6r att kombinera ett stort antal digitala resurser till en arkivfil, med tillh\u00f6rande metadata och annan relaterad information. Formatet, som dokumenteras i ISO-standarden ISO 28500:2009, \u00e4r framtaget av Internet Archive och medlemmarna i International Internet Preservation Consortium (IIPC) f\u00f6r att underl\u00e4tta just insamlingen och bevarandet av webbplatser.<\/p>\n\n\n\n<p>En WARC-fil inneh\u00e5ller en eller flera WARC-handlingar (WARC records). Varje handling\/record inneh\u00e5ller en beskrivning av inneh\u00e5llet och sj\u00e4lva handlingen. De filer som exempelvis html, gif och jpeg som har publicerats p\u00e5 en webbplats inkluderas ocks\u00e5 i WARC-filen.<a id=\"_ftnref1\" href=\"#_ftn1\">[1]<\/a>&nbsp;<\/p>\n\n\n\n<p>F\u00f6r att titta p\u00e5 en WARC-fil beh\u00f6vs s\u00e4rskild mjukvara som exempelvis WayBack Machine, utvecklat av Internet Archive. Verktyget, som \u00e4r \u00f6ppen k\u00e4llkod\/open source, kan laddas ned gratis.<\/p>\n\n\n\n<p>WARC-formatet anv\u00e4nds idag av ett stort antal institutioner \u00f6ver hela v\u00e4rlden f\u00f6r att samla in och bevara webbplatser. I Sverige anv\u00e4nds formatet av bland annat Kungliga biblioteket och kommunalf\u00f6rbundet Sydarkivera. Riksarkivet tar d\u00e4remot inte emot webbarkiveringar i filformatet WARC utan h\u00e4nvisar i st\u00e4llet till HTML i best\u00e4mmelserna i RA-FS 2009:2.<\/p>\n\n\n\n<p>WARC har m\u00e5nga f\u00f6rdelar n\u00e4r det kommer till att samla in webbplatser och beskriva dem. Hanteringen av metadata inom filen och de aggregerade filerna \u00e4r utformade f\u00f6r att underl\u00e4tta hanteringen och s\u00f6kbarheten f\u00f6r webbplatserna. N\u00e5gra nackdelar \u00e4r dock att de ing\u00e5ende filerna i WARC-arkiveringen kan vara sv\u00e5ra att bryta ut och hantera utanf\u00f6r arkivkopian. Konvertering av ing\u00e5ende filformat i en WARC-arkivering \u00e4r d\u00e4rf\u00f6r mer komplext \u00e4n vid insamling d\u00e4r kopian sparas i HTML-format. En annan nackdel \u00e4r att man blir beroende av specifika verktyg, \u00e4ven om dessa \u00e4r open source\/\u00f6ppen k\u00e4llkod, f\u00f6r att kunna titta p\u00e5 webbplatsen.<\/p>\n\n\n\n<p><a href=\"#_ftnref1\" id=\"_ftn1\">[1].<\/a> <a href=\"https:\/\/www.loc.gov\/preservation\/digital\/formats\/fdd\/fdd000236.shtml\">https:\/\/www.loc.gov\/preservation\/<\/a><a href=\"https:\/\/www.loc.gov\/preservation\/digital\/formats\/fdd\/fdd000236.shtml\">digital\/formats\/fdd\/fdd000236.shtml<\/a> (2023-11-13).<\/p>\n\n\n\n<p><\/p>\n","protected":false},"excerpt":{"rendered":"<p>Kanske har du h\u00f6rt begreppet WARC n\u00e4mnas i samband med webbarkivering och undrat vad det egentligen \u00e4r? Eller har du noterat i Arkiwera att det sedan i somras g\u00e5r att bevara sina webbplatser och sociala medier i WARC-formatet? I denna artikel ber\u00e4ttar vi kort om detta format som \u00e4r skapat just f\u00f6r att lagra arkiverade [&hellip;]<\/p>\n","protected":false},"author":2,"featured_media":269,"comment_status":"closed","ping_status":"closed","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[30,47],"tags":[],"class_list":["post-298","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-artikel-sv","category-nyheter"],"_links":{"self":[{"href":"https:\/\/staging.arkiwera.se\/wp\/wp-json\/wp\/v2\/posts\/298","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/staging.arkiwera.se\/wp\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/staging.arkiwera.se\/wp\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/staging.arkiwera.se\/wp\/wp-json\/wp\/v2\/users\/2"}],"replies":[{"embeddable":true,"href":"https:\/\/staging.arkiwera.se\/wp\/wp-json\/wp\/v2\/comments?post=298"}],"version-history":[{"count":5,"href":"https:\/\/staging.arkiwera.se\/wp\/wp-json\/wp\/v2\/posts\/298\/revisions"}],"predecessor-version":[{"id":4724,"href":"https:\/\/staging.arkiwera.se\/wp\/wp-json\/wp\/v2\/posts\/298\/revisions\/4724"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/staging.arkiwera.se\/wp\/wp-json\/wp\/v2\/media\/269"}],"wp:attachment":[{"href":"https:\/\/staging.arkiwera.se\/wp\/wp-json\/wp\/v2\/media?parent=298"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/staging.arkiwera.se\/wp\/wp-json\/wp\/v2\/categories?post=298"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/staging.arkiwera.se\/wp\/wp-json\/wp\/v2\/tags?post=298"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}