ウェブアーカイブを支える技術.
In: Journal of Information Science & Technology Association/Joho no Kagaku to Gijutsu, Jg. 67 (2017-02-01), Heft 2, S. 73-78
academicJournal
Zugriff:
In the last two decades, web archiving initiatives have spread around the world and have made substantial progresses in legislation, improvement of tools and standards, and fostering of human resources. Especially, international collaboration in the tool developments initiated by IIPC has achieved significant results that constitute the core of the web archiving technologies today. This paper shows how the tools were developed and to what extent they have been implemented into the archives, and briefly describes the mechanisms of the core technologies, Heritrix, WARC and Wayback. Furthermore, it gives an overview of full-text search tools such as NutchWAX and Solr, organization by generating metadata and Memento project which provides integrated access to open archives. [ABSTRACT FROM AUTHOR]
過去2 0 年にわたって世界各国でウェブアーカイブが行われ, 法制度の整備, 技術開発, 人材育成など様々な分野で発展を遂げてきた。 とりわけ技術開発においては, I I P C を中心とした国際的な取組の成果が顕著で, その成果は今日におけるウェブアーカイブ技術の基盤を 形成している。本稿では, それらウェブアーカイブ技術の中核であるクローラHeritrix, 保存ファイルフォーマットWARC, 閲覧ソフト Waybackを取り上げ, 各国機閣における導入状況, 開発経緯や仕組みを紹介する。また, NutchWAXやS o lrなどの全文検索エンジン, メ タデータによる組織化, アーカイブ間の連携を目指すMementoプロジヱクトについても概要を紹介する. [ABSTRACT FROM AUTHOR]
Titel: |
ウェブアーカイブを支える技術.
|
---|---|
Autor/in / Beteiligte Person: | 前田 ; 直俊 ; 大山聡 ; 聡 |
Zeitschrift: | Journal of Information Science & Technology Association/Joho no Kagaku to Gijutsu, Jg. 67 (2017-02-01), Heft 2, S. 73-78 |
Veröffentlichung: | 2017 |
Medientyp: | academicJournal |
ISSN: | 0913-3801 (print) |
Sonstiges: |
|