東京外国語大学アジア・アフリカ言語文化研究所の学術変革領域研究(A)「イスラーム信頼学」のウェブサイトで、HTR(手書き文字認識)技術を利用した写本の自動文字認識プラットフォームであるTranskribusの使い方を解説した記事”Tool #1 「10段階で分かるTranskribus」”が公開されております。
翻訳は石田友梨先生(現 岡山大学学術研究院社会文化科学学域 准教授(特任))を中心に、複数の方々が協力されています。公開日は2022.02.06で、詳細は以下の通りです。
翻訳者:石田友梨
協力者:三浦徹、熊倉和歌子、篠田知暁、須永恵美子、
宮川創、渡邉要一郎、王雯璐、笠原真理子訳者まえがき
Transkribusは、文字資料の画像から文字を自動で読み取ることのできるフリーソフトウェアです。既存のOCR(光学文字認識)ではうまく読み取ることのできない写本のアラビア文字などが、機械学習の仕組みを用いることで読み取れるようになります。画像は海外のサーバに転送されますので、資料の公開許可範囲をよく確認し(「5. 文字資料のアップロード」参照)、ご自身の責任でご利用ください。
ここでは、Transkribus公式サイトのHow To Use Transkribus in 10 Stepsの日本語訳を掲載しています。掲載許可をくださったTranskribusチームの皆様、日本語訳の協力者の皆様には厚く御礼申し上げます。
イスラーム信頼学では、Transkribusの操作方法を習得するためのワークショップも開催しておりますので、ぜひご参加ください。目次
石田 友梨. Tool #1 「10段階で分かるTranskribus」. イスラーム信頼学. https://connectivity.aa-ken.jp/newsletter/588/, (アクセス日:2023-09-14).
1. はじめに
2. Transkribusの使い方―ウェブサイトでの登録
3. ウェブサイトからのダウンロード
4. Transkribusを開く
5. 文字資料のアップロード
6. 文字資料を行(lines)に分ける
7. 転写の開始
8. 転写の保存と書き出し
9. 「手書きテキスト認識(HTR)」の使用
10. キーワード検索(Keyword Spotting)
Transkribusの使い方の記事は以下のリンク先です。