AI活用した古文書解読プロジェクト「みんなで翻刻」がリニューアル
国立歴史民俗博物館・京都大学古地震研究会・東京大学地震研究所のメンバーを中心に開発を進める古文書史料の市民参加型翻刻プラットフォーム「みんなで翻刻(ほんこく)」が、22日にリニューアル公開した。 0724-mtn「翻刻」とは、くずし字で書かれている古文書を、活字化して現代人が読めるようにする作業のこと。 2017年1月に公開された「みんなで翻刻」では、約5000人の市民が参加。600万文字以上の「くずし字」で書かれた史料が解読された。 リニューアルした新バージョンの「みんなで翻刻」では、さらに多くの災害史料やユネスコ世界記憶遺産「東寺百合文書」の未翻刻部分を、市民参加で解読。 さらに、最新のAIを使った「くずし字」の自動認識機能も搭載。凸版印刷、および人文学オープンデータ共同利用センター(ROIS-CODH)が開発した「くずし字認識システム」が利用でき、「くずし字」に慣れない初心者でもAIの支援で翻刻作業に参加できる。 今回のリニューアルでは、デジタルアーカイブの国際標準規格IIIFに対応。国立国会図書館や国文学研究資料館など、さまざまな機関が公開するデジタル史料を「みんなで翻刻」で扱うことができるようになった。 また、ユネスコ世界記憶遺産にも指定されている「東寺百合文書」や、東京大学附属図書館が所蔵する地震史料のコレクション「石本コレクション」を公開し、市民と協働で翻刻を進めていく。 翻刻されたテキストは、オープンデータとして公開、歴史研究や科学研究に役立てられる。
AIと人力で古文をより読みやすく!
AIと人力で古文をより読みやすく!
源氏物語や竹取物語など、
江戸時代以前に出版された書物の多くは「古文」で書かれています。
古文はくずし字や今とは意味合いの異なる日本語などで、
学校などで学習する機会があってもいまいち飲み込みづらかったことでしょう。
しかし物語のほかにも、災害の記録や生活風景などを記録した、
貴重な歴史がつづられている古書ですから、読み解かないわけにもいきません。
せめてくずし字だけでも読めれば、と考える方も少なくないことでしょう。
国立歴史民俗博物館ほか2大学の研究所メンバーが
中心となって開発を進めている「みんなで翻刻」が、
2019年7月22日、リニューアル公開されました。
「みんなで翻刻」は、くずし字で書かれている古文書を、
人力とAI技術を用いて活字とデータに直すプラットフォーム。
膨大な古文資料の解読を一挙に推し進めるためのプロジェクトです。
くずし字に親しみのない人でもAIの力を借りながら進めていけるため、
作業もはかどります。
誰でも参加することができるこちら。
子どもと一緒に参加すれば歴史や古文に体感的に触れることができ、
会話のきっかけにもなるため教育にも一役買っているといえるでしょう。