ひでじろうは、私の祖父の営んできた会社、加藤秀次郎商店から取った私のペンネーム、この10年ほど使っている。私は、海外と蜜に接するジャパン21の代表をこの13年間務めている。その分、普通の日本人と異なる部分と、それ故に日本を愛する部分が交錯していると自覚している。日常の生活から、感性の趣くまま、とりあえずブログなる手段を通じて、書いてみようと思う
[1] [2] [3] [4] [5]
先週は、私の10年来の夢が叶った。クイックショナリーの日本語対応、漢字リーダーが製品リリースとなったのだ。 (プレスリリース英文プレスリリースIRリリース


image_s.jpg
ウィズコム社の製品。もともと、ユダヤ人の「出来の悪い息子?」が英語を学習するために、その父親が自分のリスクで開発したもの、解らない英語の単語をなどる(スキャン)するとそのイメージが取り込まれ、前画像処理、文字認識を経て、内部の辞書データベースを検索し、その結果をディスプレーに出力するペン型電子辞書。1996年ごろ、私がイスラエルに通い始めた頃に初期の製品がリリースされ、話題だった。1999年ごろから、当社との関係が確立し、現在に至るまで10年近く輸入、販売している。世界ではこれまでに百万台以上が販売された。

いわゆる電子辞書は、一文字づつキーボードで入力する。慶応大学の学生のレポートによれば、紙の辞書だと一分間に2-3回辞書引きでき、電子辞書だと5回くらい出来るとの結果がある。学習辞書という考え方も在るが、本来の読書というのは、その文脈を理解するのが目的。紙をめくったり、キーボードを叩いたりするのは、その目的からすると物凄く邪魔な作業である。一分間に5回の電子辞書での辞書引きは、辞書引き自体が目的で、「必死になって」やれば可能かもしれないが、「読書」という観点からすると、何をしているのか解らなくなってしまう。クイックショナリーは、この問題を見事に解決する。「なぞるだけ」で、1-2秒で辞書引きが可能となる。後は、文脈の理解に集中すれば良い。

クイックショナリーは、「辞書引きの手間を革新的に簡略化して、ユーザーが速く、深く文脈を理解できるようにする道具」、「Portable Reading Assistance」、と定義できる。或いは、辞書引きのスピードに特化した特殊な電子辞書とも表現できる。

入力の言語は、当初は英語を中心とするヨーロッパ言語、英語、フランス語、ドイツ語、スペイン語、イタリア語、ポルトガル語、オランダ語、出力の言語は、それに加え、中国語、日本語、ハングル語、ロシア語、ヘブライ語などに対応してた。

ここまであれば、当然のことながら、日本語を入力言語としてできないかとのテーマが上がってくる。このテーマ、1999年に私がウィズコム社で行った最初の提案に登場し、5-6年前には、日本の或るメーカーとタイアップして開発着手したが、製品化にまで至れなかった経緯がある。日本語のOCR処理の精度と時間が、仕様を満たさなかったのだ。

そして、この2年ほど前に登場したのが、中国語対応のクイックショナリー、中国語をきっちりと読むのを見て、これをプラットフォームにすれば、日本語クイックショナリーを開発できると判断した。


●    開発のテーマ

次は、搭載する辞書データベースの選定、クイックショナリーは、ペン型の辞書、ディスプレーの大きさには限りがある。説明の多い学習型の辞書は、あまり適さない。語彙数が多く、説明が簡易で、英和、和英、国語の3つがあり、電子データ化が行われているといる広く使われている辞書との条件で、三省堂さんのデイリーコンサイスを第一候補として、使用許諾のお願いに上がり、快諾をいただいた。

ここからが開発活動。辞書データベースは、基本形しか表記されておらず、OCRを前提にして辞書引きするには「加工」が必要となる。学校で習った活用、未然形、連体形、終止形、連用形、仮定形、命令形というあれである。これを基本形に戻してやらないと辞書引きできない。ご存知のように、動詞、形容詞、形容動詞、助動詞には活用がある。次いで、出てくるのが「ゆれ」、例えば、「焼肉定食」は、正しい国語では、「焼き肉定食」であり、こんなのが実は沢山存在する。辞書データにない様々なケースをどこまでカバーするのかは、最後まで問題だった。

次に出てくるのが、OCRの問題、日本語は、基本的にひらがな、カタカナ、漢字が存在し、アルファベットや数字、句読点なども混在する。例えば、漢字の「口」とカタカナの「ロ」、ひらがなの「へ」とカタカナの「ヘ」なんて組み合わせをOCRに「ちゃんと読み分けろ」といっても無理というもの。或いは、発音と濁音、「ぺ」、「べ」、「ぱ」、「ば」なんてのも、結構間違えて読んでくれる。実は、我々人間も、こんなのは読めていない、文脈で読んでいるのだ。こんなケースを正しく辞書引きできるようにするには、どうすれば良いか。英語には、スペルチェッカーという道具があり、OCRの間違いをソフトウェアが補正してくれるが、日本語には、使えるスペルチェッカーが存在しない。

次が、どこからどこから辞書引きすればよいかの問題、ヨーロッパ言語には単語ごとにスペースで区切るルールがあるが、日本語にはスペースがない。日本語を構文分析するには、形態素解析という技術があるのだが、PCで行っても不完全な代物で、こんな小さい道具には入らないし、OCRの精度も十分でない。早くて、実用的な道具にするには、どんなやり方が良いのか。

縦書きと横書きも問題。もともとが、横書きを前提に開発された商品、縦書きの時には、どう持ってスキャンするのか、縦書きと横書きは、自動認識か手動モード変更か、縦書きの時のかぎ括弧、長音は、形自体が違うが、どうするのか。

などなど、日本語を知らないイスラエルの開発担当と、日夜の議論、ひょとするとこんな開発が完成したのは、奇跡に近いかもしれない。開発の期間中、2ヶ月に一度は、エルサレムのオフィスに出向き、開発担当の机に一緒に座って、「どうするか?」の議論をしてきた。結構難しいことを、やり遂げたような気がする。


●    こんなことが出来ます。(効能書き)

まずは、得意の英語から日本語への辞書引き(英和辞典)、これは、何の問題もなく素晴らしい。解らない英単語があれば、これをスキャンするだけで、1-2秒で表示される。

次に、漢字(漢字かな混じり)の和英、国語辞典での辞書引き、これが今回のプロジェクトのメインテーマとなる。読みの解らない漢字の辞書引きは、殆ど拷問のような作業、漢和辞典を使って、部首検索、総画検索、手書き入力などの手段があるが、どれも手間暇がかかり、必要に迫られないとやる気にはならない。スキャンするだけでこの辞書引きが出来れば、エポックメーキングな道具となること請け合い。「漢字リーダー」はこれを見事に成し遂げた。正しくOCR認識され、辞書にある限り、本当に2秒程度で意味と発音が表示される。外国人の日本語学習者がこれを使うかもとの配慮から、ローマ字の発音表記も加えることにした。

カタカナ語も今回のテーマの一つ、国語辞典も和英辞典も、辞書にある限りはその意味が表示される。特に、元の英語が表示さえるのは、価値があるような気がする。

最後が、ひらがな語、実は、これが今回一番苦労した。我々が日本人であっても「ひらがな」だけで表現された文章を理解するのは結構難しい。考えれば分かるが、直感的にはどこでどう区切って読むのかは、推測だし、時間もかかる。日本人にとっては、ひらがな語を辞書引きする機会は余りなく、プライオリティーが低いと判断していたのだが、イスラエルの担当が、「外国人も使うから」との理由で、結構気合が入り、時間を使った。ひらがなモードを作り、辞書にある限りは、ひらがな語の辞書引きも可能である。

英和辞典の辞書引きは、これまでもあり、開発担当にとっては、「今までどおり」だが、初めてクイックショナリーをお使いの方には、「感激!!」するほどのスピードで辞書引きできる。漢字の辞書も同様、気楽に2秒で引ける辞書は、世の中に存在しない。


●  まとめ

○    クイックショナリーは、1-2秒で引けるスピード重視、時間重視のペン型電子辞書
○    読書に集中できる辞書、速く読める辞書、難解な文章でも読みこなせる辞書
(辞書引きが簡単なので)
○    解らない漢字を2秒で辞書引きできる辞書、読みが判らなくても2秒で辞書引きできる
○    英和、和英、国語の実用性の高い三省堂デイリーコンサイスを搭載している

○    辞書引きの嫌いな方に、不精な方に
○    漢字の読みで苦労している方に
○    沢山の文章を読む方に
○    英文を多読する方に
○    国語の成績の悪い方に、常用漢字(約2000)が読めない方に
○    日本語学習者の方に
○    キーボードの入力が苦手(面倒)な方に

●    終わりに

技術革新は、人間の能力を補完して、これまで出来なかったことを可能にする。クルマ、テレビ、電話、インターネット、それぞれがその役割を果たした。今回の「漢字リーダー」は、そんな大発明ではないかも知れないが、これまで殆ど出来なかった「読みの解らない漢字の辞書引き」という作業を革新的に簡便にできる。イスラエルと日本の小さな企業が協力して成し遂げた「魔法の道具」を是非お使いいただきたい。

最後に、この開発に関わったウィズコム社の方々、ご協力をいただいた三省堂の皆様、そして、この開発に関わったジャパン21のチームの諸氏、この場をお借りしてお礼を述べたい。

qt2j_logo_j.png

拍手[0回]

ほんやくコンニャクは、ドラえもんの道具(2000個くらい在るそうだが)の欲しいものランキング(GOO調査)によると、どこでもドア、タイムマシーン、タケコプターに続く第4位。なかなかの地位を占める。瞬間空間移動(どこでもドア)や、瞬間時間移動(タイムマシン)に比べると、技術的な困難さは、低いように見えるが、

一見地味に見える、誰とでも(動物、植物、宇宙人、含め)会話できる、読める、書ける、コミュニケーションできる道具は、なかなか人気が高い。どこでもドア、タイムマシン、

現存するほんやくコンニャクに一番近い道具は、多分、グローバルトーカーなどと呼ばれる、2000位の通常使われる固定フレーズを、10-20ヶ国語程度録音し、音声データベースにし、ユーザーが、ホテルでチェックイン、レストランでの注文、などの状況にあわせて、選択して機会に発音させる奴。行き先の国で、何も会話ができない時、確かに、サバイバルレベルのコミュニケーションを簡単にするには、良い道具と思う。当社でも一度扱おうとしたことがあり、その時のメーカーの言い方は、「米軍がイラクでも使ってる!!」、職務尋問レベルの会話であれば定型的なのでできるかもしれない。

一方で、現存するのがパソコンやウェブの機械翻訳、「You are the apple of my eyes.」  というのを、「貴方は私の目のリンゴだ」、と勿論訳す。実は、当社の取扱商品に、全文翻訳をサーバーで行うバビロンがあるのだが、どうもこの全文翻訳は個人的にも好きになれない。全く勉強する気がない言語で、とりあえず、どんなことが書いてあるか知りたい時に、一寸だけ使ってみる道具か。何れにしても、全文機械翻訳を道具として使ったら、その人のその外国語が全く進歩しない、学習しないのはたしかた。

拍手[0回]

昨日は、日本在住5年のイスラエル女性と食事をした。彼女の専門分野は、日本語と日本文化、勿論、母国語のヘブライ語と世界語の英語は堪能、それに加えて、日常会話程度の日本語を話す。

●   日本人は、絶対に英語をもっと勉強しないとだめ
●   世界で戦うには、英語しかないよ
●   日本人は、英語はできても、英語のコミュニケーションができないし、
●   ジェントルマンであることを知らないし、

● ヘブライ語(国語)は、小学校の低学年で教育が終わる
●   日本語(国語)は、高校3年まで、毎日勉強しても、まだ不完全でビジネスでは使えない
●   日本語をもっと簡単にすれば、世界語(英語)も機械語(コンピュータ言語)も空いた時間で勉強できる

はい、明らかにわが国が検討しなければいけないテーマです。
品格ある日本人としては、どう考える??

拍手[1回]

小学校でならう漢字は、約1、000、いわゆる教育漢字というやつだ。中学校、高校レベルで、常用漢字を習得、約2000に達する。我々日本人は、この2、000の漢字をベースにして日常生活をしている。

小学校は、6年間、一年で約200漢字、その後も、高校卒業まであと6年で、1000個覚えるとすれば、やはり、一年約200個の漢字を覚えることになる。一年365日、日曜、祭日などを除くと、250日、小学校の一年から、高校卒業まで、休みの日を除いて毎日一つづつ漢字を覚えるのが、日本人として認められる必要条件となる。世界各国の言語を使いこなすのに必要な時間(エネルギー)のレベルの客観的数字がどの程度結論づけらえれているか知らないが、日本語を習得するにかなりの時間が必要なのは多分、想像どおりと思う。

実は、私の机に現在、漢字検定の本がならんでいる。常用漢字レベルは、概ね2級に値する。ざっくり見てみると、自信が出てくる。「2級は軽いぜ!!」と思ったのは良いが、突然その自信が崩れた。「漢字を書く」というテスト問題である。昨今、「手書きする」という機会が極めて少ない。文書は全てパソコンで(このブログも含めて)、書いていて、ペンを取って紙に文字を書くのは、サインとミーティングの時のメモ書きだけ、しかも、半分は英語、これでは、昔取った杵柄であるはずの「日本語を書く」という能力が維持できてないのだ。

21世紀の初頭、我々はパソコンという殆ど万能のアシスタントを前提としてことばを書き、読んでいる。この分で行くと、日本語を手で書く能力は、猛烈な勢いで衰える。「読む」方は、多分当分の間維持できる。

そんな環境の中で、世界統一言語である「英語」学習という要素が入ってくる。「英語」で読み、書き、議論し、考え、泣き、笑い、飯を食べ、夢を見る、そんなことが出来ないと「国際人」の仲間には入れない。今から100年の間に、日本人は、日本語を取るか、英語を取るかの選択を迫られる。勿論、実際には、両方をバランスよくとの優等生的回答になるのだろうが、日本語をもう少し簡単にしないと、負担が大きすぎるのも事実のような気がするのだが、

拍手[0回]

今朝の日経新聞日曜版に、電子辞書に関する記事が記載されていた。記事の内容は、紙の辞書か、電子辞書か。電子辞書の派生のような、OCR付きの電子辞書(電子辞書カテゴリーにいれるのにいつも抵抗があるが)、クイックショナリーを売る張本人としては、自分自身の備忘録も兼ねて、一文書いておきたい。記事曰く、
 
●    国内の電子辞書は、約300万台、640億円の市場、台数ベースで微減、売上げベースで微増
●    紙の辞書は、10年前が約1200万冊、現在は約650万冊、金額ベースでは、240億円が160億円に減少
●    電子辞書を推薦している高校は、16.7%
●    一分間に調べられる単語数は、電子辞書が5.0語、家事の辞書は、2.4語、電子辞書は約2倍の語句が調べられる
●    よく使う辞書は、英和58.3%、和英44.6%、広辞苑44.5%、国語、漢和が20%ほど、他は10%以下
●    電子辞書を持っていない人の比率、70%、その理由は、パソコンで調べる(48%)、機会がない(45%)、価格が高い(38%)
 
○    記事でも引用された、「電子辞書の利用実態と今後」という慶応大学の調査によれば、今後は、圧倒的に電子辞書
 
恐らく、辞書を「語学学習の一部」と考えるか、「解らない言葉の意味を調べる道具」と考えるかで、紙辞書派と電子辞書派が分かれるようだ。我がクイックショナリーは、OCR付き電子辞書、一分間に調べられる単語数は、確実に電子辞書の2倍以上、しかも、必死でキーボードを叩いたり、紙をめくったりする必要がない。、「解らない言葉の意味を調べる道具」としては、圧勝間違いない。

拍手[0回]

カレンダー
07 2018/08 09
S M T W T F S
1 2 3 4
5 6 7 8 9 10 11
12 13 14 15 16 17 18
19 20 21 22 23 24 25
26 27 28 29 30 31
フリーエリア
プロフィール
HN:
ひでじろう
年齢:
66
性別:
男性
誕生日:
1951/04/08
自己紹介:
連絡先: hidejiro@japan21.co.jp
バーコード
ブログ内検索
最古記事
カウンター
アクセス解析
Powered by ニンジャブログ  Designed by 穂高
Copyright © ひでじろうブログ All Rights Reserved
/