山田工業：山田の目blog: くずし字が簡単に読めるかも

山田工業社員の目から見た日常をお伝えします。

山田工業ホームページ

←

2026年7月

→

日

月

火

水

木

金

土

最近の記事

令和丙午８年新秩父観音霊場ご開 ..
慈恩寺１２００周年
埼玉県連若鳶会50周年
令和5年1月号
持ち上げました
12年ぶりの激レア
さいたま新聞に載りました
浦和の出初め
埼玉WABI SABI大祭典２０２０
妻沼聖天の御開帳

過去ログ

2026年 3月 2024年 9月 2023年 6月 2023年 1月 2022年 6月 2022年 4月 2022年 1月 2020年10月 2019年 3月 2018年12月 2018年 9月 2018年 7月 2018年 6月 2018年 1月 2017年11月 2017年 5月 2017年 4月 2017年 3月 2016年11月 2016年10月 2016年 9月 2016年 8月 2016年 7月 2016年 6月 2016年 5月 2016年 4月 2016年 3月 2016年 2月 2016年 1月 2015年11月 2015年10月 2015年 9月 2015年 8月 2015年 7月 2015年 5月 2015年 4月 2015年 1月 2014年12月 2014年11月 2014年10月 2014年 8月 2014年 6月 2014年 5月 2014年 4月 2014年 3月 2014年 2月 2014年 1月 2013年12月 2013年11月 2013年10月 2013年 9月 2013年 8月 2013年 7月 2013年 6月 2013年 4月 2013年 3月 2013年 2月 2013年 1月 2012年12月 2012年11月 2012年10月 2012年 9月 2012年 8月 2012年 7月 2012年 6月 2012年 5月 2012年 4月 2012年 2月 2012年 1月 2011年12月 2011年11月 2011年10月 2011年 9月 2011年 8月 2011年 7月 2011年 6月 2011年 5月 2011年 4月 2011年 3月 2011年 2月 2011年 1月 2010年12月 2010年11月 2010年10月 2010年 9月 2010年 8月 2010年 7月 2010年 6月 2010年 5月 2010年 4月 2010年 3月 2010年 2月 2010年 1月 2009年12月 2009年11月 2009年10月 2009年 9月 2009年 7月 2009年 6月 2009年 4月 2009年 2月 2009年 1月 2008年12月 2008年11月 2008年10月 2008年 9月 2008年 8月 2008年 7月 2008年 6月 2008年 5月 2008年 4月 2008年 3月 2008年 2月 2008年 1月 2007年12月 2007年11月 2007年10月 2007年 9月 2007年 8月 2007年 7月 2007年 6月 2007年 5月 2007年 4月 2007年 3月 2007年 2月 2007年 1月 2006年12月 2006年11月 2006年10月 2006年 8月 2006年 7月 2006年 6月 2006年 5月 2006年 4月 2006年 3月

≪ カタカナ語の氾濫 ¦ トップページ ¦ まいんち梅雨空ですけど ≫

くずし字が簡単に読めるかも

凸版印刷株式会社が「くずし字を判別してテキストデータ化するOCR（光学文字認識）技術」を開発したと発表しました。

凸版印刷（株）では、この技術による古典籍のテキストデータ化サービスを2015年夏から試験的に開始するそうです。

江戸期以前の本や明治期の手書きの文章の多くは「くずし字」を使って書かれており、楷書で読み書きを教えられた昭和特に戦後生まれの人では読めない人がほとんどです。

くずし字の学習は近世以前の日本文学や日本史を学ぶ学生にとっては必要不可欠で、多くの学生が「よ、読めない……」と悲鳴を上げているそうですが、遊んでるんだか、バイトしに行ってるんだか、およそ学生とは名ばかりの学生には当然だと思います。

しかし、凸版印刷の開発した技術は、書物のくずし字を自動で判読し、テキストデータ化することを可能にするもので、専門の学習をしていない素人にも読めるかもしれない朗報です。

凸版印刷で2014年に実施した検証実験では、くずし字で記されている書物を80%以上の精度でOCR処理することができたとのこと。

OCRで判読した文字は更に専門家によって校正・校閲され、その結果はくずし字のデータベースにフィードバックされます。

「源氏物語」（絵入本，国文研所蔵）のOCRによるテキストデータ化の例

　現在、くずし字で書かれている古典籍は100万点以上と言われていて、大部分が翻刻（ほんこく、くずし字で書かれた文献を楷書に直したり活字で出版するなどして読みやすい形式にすること）されていません。

この技術が広まれば、専門の翻訳家に頼らないでもくずし字を訳せるので、安く、また大量にデータ化することも可能です。

自分の持っている明治期の千社札や、納札に関する資料も読めるようになればいいな〜。

17:45, Wednesday, Jul 08, 2015 ¦ 固定リンク

■コメント

△ページのトップへ