山田の目blog

山田工業社員の目から見た日常をお伝えします。

山田工業ホームページ

 

2015年7月
      1 2 3 4
5 6 7 8 9 10 11
12 13 14 15 16 17 18
19 20 21 22 23 24 25
26 27 28 29 30 31

最近の記事
埼玉県連若鳶会50周年

令和5年1月号

持ち上げました

12年ぶりの激レア

さいたま新聞に載りました

浦和の出初め

埼玉WABI SABI大祭典2020

妻沼聖天の御開帳

平成最後の出初式

過去ログ
2023年 6月
2023年 1月
2022年 6月
2022年 4月
2022年 1月
2020年10月
2019年 3月
2018年12月
2018年 9月
2018年 7月
2018年 6月
2018年 1月
2017年11月
2017年 5月
2017年 4月
2017年 3月
2016年11月
2016年10月
2016年 9月
2016年 8月
2016年 7月
2016年 6月
2016年 5月
2016年 4月
2016年 3月
2016年 2月
2016年 1月
2015年11月
2015年10月
2015年 9月
2015年 8月
2015年 7月
2015年 5月
2015年 4月
2015年 1月
2014年12月
2014年11月
2014年10月
2014年 8月
2014年 6月
2014年 5月
2014年 4月
2014年 3月
2014年 2月
2014年 1月
2013年12月
2013年11月
2013年10月
2013年 9月
2013年 8月
2013年 7月
2013年 6月
2013年 4月
2013年 3月
2013年 2月
2013年 1月
2012年12月
2012年11月
2012年10月
2012年 9月
2012年 8月
2012年 7月
2012年 6月
2012年 5月
2012年 4月
2012年 2月
2012年 1月
2011年12月
2011年11月
2011年10月
2011年 9月
2011年 8月
2011年 7月
2011年 6月
2011年 5月
2011年 4月
2011年 3月
2011年 2月
2011年 1月
2010年12月
2010年11月
2010年10月
2010年 9月
2010年 8月
2010年 7月
2010年 6月
2010年 5月
2010年 4月
2010年 3月
2010年 2月
2010年 1月
2009年12月
2009年11月
2009年10月
2009年 9月
2009年 7月
2009年 6月
2009年 4月
2009年 2月
2009年 1月
2008年12月
2008年11月
2008年10月
2008年 9月
2008年 8月
2008年 7月
2008年 6月
2008年 5月
2008年 4月
2008年 3月
2008年 2月
2008年 1月
2007年12月
2007年11月
2007年10月
2007年 9月
2007年 8月
2007年 7月
2007年 6月
2007年 5月
2007年 4月
2007年 3月
2007年 2月
2007年 1月
2006年12月
2006年11月
2006年10月
2006年 8月
2006年 7月
2006年 6月
2006年 5月
2006年 4月
2006年 3月

 



くずし字が簡単に読めるかも
凸版印刷株式会社が「くずし字を判別してテキストデータ化するOCR(光学文字認識)技術」を開発したと発表しました。




凸版印刷(株)では、この技術による古典籍のテキストデータ化サービスを2015年夏から試験的に開始するそうです。




江戸期以前の本や明治期の手書きの文章の多くは「くずし字」を使って書かれており、楷書で読み書きを教えられた昭和特に戦後生まれの人では読めない人がほとんどです。




くずし字の学習は近世以前の日本文学や日本史を学ぶ学生にとっては必要不可欠で、多くの学生が「よ、読めない……」と悲鳴を上げているそうですが、遊んでるんだか、バイトしに行ってるんだか、およそ学生とは名ばかりの学生には当然だと思います。




しかし、凸版印刷の開発した技術は、書物のくずし字を自動で判読し、テキストデータ化することを可能にするもので、専門の学習をしていない素人にも読めるかもしれない朗報です。




凸版印刷で2014年に実施した検証実験では、くずし字で記されている書物を80%以上の精度でOCR処理することができたとのこと。




OCRで判読した文字は更に専門家によって校正・校閲され、その結果はくずし字のデータベースにフィードバックされます。


11573165137
「源氏物語」(絵入本,国文研所蔵)のOCRによるテキストデータ化の例
















 現在、くずし字で書かれている古典籍は100万点以上と言われていて、大部分が翻刻(ほんこく、くずし字で書かれた文献を楷書に直したり活字で出版するなどして読みやすい形式にすること)されていません。
11573165214





この技術が広まれば、専門の翻訳家に頼らないでもくずし字を訳せるので、安く、また大量にデータ化することも可能です。

自分の持っている明治期の千社札や、納札に関する資料も読めるようになればいいな〜。



17:45, Wednesday, Jul 08, 2015 ¦ 固定リンク

■コメント

△ページのトップへ
 


最近のコメント

最近のトラックバック

携帯で読む


Powered by CGI RESCUE