サクサク読めて、アプリ限定の機能も多数!
トップへ戻る
ChatGPT
note.com/kotaro_kinoshita
YomiToku を公開してから約 1 年が経過しました。ここであらためて、 なぜ YomiToku を公開したのか なぜ NC ライセンスという形を採用したのか 何が解決できているのか を整理して note にまとめます。 背景YomiToku は、日本語に特化した AI-OCR・レイアウト解析を行う文書解析エンジンです。2024 年 11 月末の公開以降、GitHub のスター数は 1,000 を超え、多くの反響をいただいています。 現在、YomiToku は無料で公開していますが、完全な OSS ではなく、NC(Non-Commercial)ライセンスで提供しています。NC ライセンスは「非商用」という大枠はあるものの、世界的に見ても厳密な定義が存在しない曖昧なライセンス体系です。 そのため、利用者が迷わないように、私は以下のような線引きで運用 しています。実際にお問い合わせをいただ
はじめに最近、LLMへのRAGを用いた文書データの連携等を目的に海外を中心にOCRや文書画像解析技術に関連する新しいサービスが活発にリリースされています。 しかし、その多くは日本語をメインターゲットに開発されているわけではありません。日本語文書は、英数字に加えて、ひらがな、漢字、記号など数千種類の文字を識別する必要があったり、縦書きなど日本語ドキュメント特有のレイアウトに対処する必要があったりと日本語特有の難しさがあります。 ですが、今後、海外の開発者がこれらの課題に対処するため、日本のドキュメント画像解析に特化したものをリリースする可能性は低く、やはり自国の言語向けのサービスは自国のエンジニアが開発すべきだと筆者は考えています。 もちろん、Azure document Intelligenceをはじめとした、クラウドサービスのドキュメント解析サービスはありますが、クラウドを利用できないユ
このページを最初にブックマークしてみませんか?
『note.com』の新着エントリーを見る
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く