ひでじろうは、私の祖父の営んできた会社、加藤秀次郎商店から取った私のペンネーム、この10年ほど使っている。私は、海外と蜜に接するジャパン21の代表をこの13年間務めている。その分、普通の日本人と異なる部分と、それ故に日本を愛する部分が交錯していると自覚している。日常の生活から、感性の趣くまま、とりあえずブログなる手段を通じて、書いてみようと思う
[212] [211] [210] [209] [207] [206] [208] [205] [204] [203] [202]
先週は、私の10年来の夢が叶った。クイックショナリーの日本語対応、漢字リーダーが製品リリースとなったのだ。 (プレスリリース英文プレスリリースIRリリース


image_s.jpg
ウィズコム社の製品。もともと、ユダヤ人の「出来の悪い息子?」が英語を学習するために、その父親が自分のリスクで開発したもの、解らない英語の単語をなどる(スキャン)するとそのイメージが取り込まれ、前画像処理、文字認識を経て、内部の辞書データベースを検索し、その結果をディスプレーに出力するペン型電子辞書。1996年ごろ、私がイスラエルに通い始めた頃に初期の製品がリリースされ、話題だった。1999年ごろから、当社との関係が確立し、現在に至るまで10年近く輸入、販売している。世界ではこれまでに百万台以上が販売された。

いわゆる電子辞書は、一文字づつキーボードで入力する。慶応大学の学生のレポートによれば、紙の辞書だと一分間に2-3回辞書引きでき、電子辞書だと5回くらい出来るとの結果がある。学習辞書という考え方も在るが、本来の読書というのは、その文脈を理解するのが目的。紙をめくったり、キーボードを叩いたりするのは、その目的からすると物凄く邪魔な作業である。一分間に5回の電子辞書での辞書引きは、辞書引き自体が目的で、「必死になって」やれば可能かもしれないが、「読書」という観点からすると、何をしているのか解らなくなってしまう。クイックショナリーは、この問題を見事に解決する。「なぞるだけ」で、1-2秒で辞書引きが可能となる。後は、文脈の理解に集中すれば良い。

クイックショナリーは、「辞書引きの手間を革新的に簡略化して、ユーザーが速く、深く文脈を理解できるようにする道具」、「Portable Reading Assistance」、と定義できる。或いは、辞書引きのスピードに特化した特殊な電子辞書とも表現できる。

入力の言語は、当初は英語を中心とするヨーロッパ言語、英語、フランス語、ドイツ語、スペイン語、イタリア語、ポルトガル語、オランダ語、出力の言語は、それに加え、中国語、日本語、ハングル語、ロシア語、ヘブライ語などに対応してた。

ここまであれば、当然のことながら、日本語を入力言語としてできないかとのテーマが上がってくる。このテーマ、1999年に私がウィズコム社で行った最初の提案に登場し、5-6年前には、日本の或るメーカーとタイアップして開発着手したが、製品化にまで至れなかった経緯がある。日本語のOCR処理の精度と時間が、仕様を満たさなかったのだ。

そして、この2年ほど前に登場したのが、中国語対応のクイックショナリー、中国語をきっちりと読むのを見て、これをプラットフォームにすれば、日本語クイックショナリーを開発できると判断した。


●    開発のテーマ

次は、搭載する辞書データベースの選定、クイックショナリーは、ペン型の辞書、ディスプレーの大きさには限りがある。説明の多い学習型の辞書は、あまり適さない。語彙数が多く、説明が簡易で、英和、和英、国語の3つがあり、電子データ化が行われているといる広く使われている辞書との条件で、三省堂さんのデイリーコンサイスを第一候補として、使用許諾のお願いに上がり、快諾をいただいた。

ここからが開発活動。辞書データベースは、基本形しか表記されておらず、OCRを前提にして辞書引きするには「加工」が必要となる。学校で習った活用、未然形、連体形、終止形、連用形、仮定形、命令形というあれである。これを基本形に戻してやらないと辞書引きできない。ご存知のように、動詞、形容詞、形容動詞、助動詞には活用がある。次いで、出てくるのが「ゆれ」、例えば、「焼肉定食」は、正しい国語では、「焼き肉定食」であり、こんなのが実は沢山存在する。辞書データにない様々なケースをどこまでカバーするのかは、最後まで問題だった。

次に出てくるのが、OCRの問題、日本語は、基本的にひらがな、カタカナ、漢字が存在し、アルファベットや数字、句読点なども混在する。例えば、漢字の「口」とカタカナの「ロ」、ひらがなの「へ」とカタカナの「ヘ」なんて組み合わせをOCRに「ちゃんと読み分けろ」といっても無理というもの。或いは、発音と濁音、「ぺ」、「べ」、「ぱ」、「ば」なんてのも、結構間違えて読んでくれる。実は、我々人間も、こんなのは読めていない、文脈で読んでいるのだ。こんなケースを正しく辞書引きできるようにするには、どうすれば良いか。英語には、スペルチェッカーという道具があり、OCRの間違いをソフトウェアが補正してくれるが、日本語には、使えるスペルチェッカーが存在しない。

次が、どこからどこから辞書引きすればよいかの問題、ヨーロッパ言語には単語ごとにスペースで区切るルールがあるが、日本語にはスペースがない。日本語を構文分析するには、形態素解析という技術があるのだが、PCで行っても不完全な代物で、こんな小さい道具には入らないし、OCRの精度も十分でない。早くて、実用的な道具にするには、どんなやり方が良いのか。

縦書きと横書きも問題。もともとが、横書きを前提に開発された商品、縦書きの時には、どう持ってスキャンするのか、縦書きと横書きは、自動認識か手動モード変更か、縦書きの時のかぎ括弧、長音は、形自体が違うが、どうするのか。

などなど、日本語を知らないイスラエルの開発担当と、日夜の議論、ひょとするとこんな開発が完成したのは、奇跡に近いかもしれない。開発の期間中、2ヶ月に一度は、エルサレムのオフィスに出向き、開発担当の机に一緒に座って、「どうするか?」の議論をしてきた。結構難しいことを、やり遂げたような気がする。


●    こんなことが出来ます。(効能書き)

まずは、得意の英語から日本語への辞書引き(英和辞典)、これは、何の問題もなく素晴らしい。解らない英単語があれば、これをスキャンするだけで、1-2秒で表示される。

次に、漢字(漢字かな混じり)の和英、国語辞典での辞書引き、これが今回のプロジェクトのメインテーマとなる。読みの解らない漢字の辞書引きは、殆ど拷問のような作業、漢和辞典を使って、部首検索、総画検索、手書き入力などの手段があるが、どれも手間暇がかかり、必要に迫られないとやる気にはならない。スキャンするだけでこの辞書引きが出来れば、エポックメーキングな道具となること請け合い。「漢字リーダー」はこれを見事に成し遂げた。正しくOCR認識され、辞書にある限り、本当に2秒程度で意味と発音が表示される。外国人の日本語学習者がこれを使うかもとの配慮から、ローマ字の発音表記も加えることにした。

カタカナ語も今回のテーマの一つ、国語辞典も和英辞典も、辞書にある限りはその意味が表示される。特に、元の英語が表示さえるのは、価値があるような気がする。

最後が、ひらがな語、実は、これが今回一番苦労した。我々が日本人であっても「ひらがな」だけで表現された文章を理解するのは結構難しい。考えれば分かるが、直感的にはどこでどう区切って読むのかは、推測だし、時間もかかる。日本人にとっては、ひらがな語を辞書引きする機会は余りなく、プライオリティーが低いと判断していたのだが、イスラエルの担当が、「外国人も使うから」との理由で、結構気合が入り、時間を使った。ひらがなモードを作り、辞書にある限りは、ひらがな語の辞書引きも可能である。

英和辞典の辞書引きは、これまでもあり、開発担当にとっては、「今までどおり」だが、初めてクイックショナリーをお使いの方には、「感激!!」するほどのスピードで辞書引きできる。漢字の辞書も同様、気楽に2秒で引ける辞書は、世の中に存在しない。


●  まとめ

○    クイックショナリーは、1-2秒で引けるスピード重視、時間重視のペン型電子辞書
○    読書に集中できる辞書、速く読める辞書、難解な文章でも読みこなせる辞書
(辞書引きが簡単なので)
○    解らない漢字を2秒で辞書引きできる辞書、読みが判らなくても2秒で辞書引きできる
○    英和、和英、国語の実用性の高い三省堂デイリーコンサイスを搭載している

○    辞書引きの嫌いな方に、不精な方に
○    漢字の読みで苦労している方に
○    沢山の文章を読む方に
○    英文を多読する方に
○    国語の成績の悪い方に、常用漢字(約2000)が読めない方に
○    日本語学習者の方に
○    キーボードの入力が苦手(面倒)な方に

●    終わりに

技術革新は、人間の能力を補完して、これまで出来なかったことを可能にする。クルマ、テレビ、電話、インターネット、それぞれがその役割を果たした。今回の「漢字リーダー」は、そんな大発明ではないかも知れないが、これまで殆ど出来なかった「読みの解らない漢字の辞書引き」という作業を革新的に簡便にできる。イスラエルと日本の小さな企業が協力して成し遂げた「魔法の道具」を是非お使いいただきたい。

最後に、この開発に関わったウィズコム社の方々、ご協力をいただいた三省堂の皆様、そして、この開発に関わったジャパン21のチームの諸氏、この場をお借りしてお礼を述べたい。

qt2j_logo_j.png

拍手[0回]

この記事にコメントする
お名前
タイトル
文字色
URL
コメント
パスワード Vodafone絵文字 i-mode絵文字 Ezweb絵文字
この記事へのトラックバック
この記事にトラックバックする:
カレンダー
08 2018/09 10
S M T W T F S
1
2 3 4 5 6 7 8
9 10 11 12 13 14 15
16 17 18 19 20 21 22
23 24 25 26 27 28 29
30
フリーエリア
プロフィール
HN:
ひでじろう
年齢:
67
性別:
男性
誕生日:
1951/04/08
自己紹介:
連絡先: hidejiro@japan21.co.jp
バーコード
ブログ内検索
最古記事
カウンター
アクセス解析
Powered by ニンジャブログ  Designed by 穂高
Copyright © ひでじろうブログ All Rights Reserved
/