化粧品研究者こまっきーの語り部屋

化粧品研究者こまっきーが普段考えていることを書き留める、日記のようなもの。

AIは日本語が正確に読めるようになるか。

最近、iPhoneの読み上げ機能を使って、ニュースを聴いています。
YouTubeで各メディアの報道もありますが、動画だと映像ありきの説明になります。
皿を洗っているときや洗濯物を干しているときなど、ずっと画面を観れない状態の時に読み上げ機能を使っているので、書いてある記事を読み上げてもらった方が丁寧で分かりやすいです。
すると読み方の間違いが結構多くて、面白いなと思ったので紹介したいと思います。

まずは辛いです。
辛いは“からい”とも読みますし、“つらい”とも読みます。
ですがこれを読み上げ機能で読んでみると、全部“からい”になっていました。
AIなので前後の脈絡を考慮して選択できるのではないかと思いきや、「仕事が辛い原因や•••」の辛いは“からい”と読んでいました。

辛いを“からい”と読むのに、Googleで“辛い”を検索すると、“つらい”に関するページばかりが出てきました。
検索結果1ページ目に出てきた“からい”に関するページは1つだけでした。

その検索結果をみていると、“つらい”はひらがなで表記されていました。
「なるほど。辛いは“つらい”と“からい”という別の意味が喧嘩するから、“つらい”はひらがな表記にしているのか。」とGoogle検索に合わせた工夫に感心しましたが、“辛い”で検索して出てくるのは“つらい”に関するページばかりですから、読みと検索結果がチグハグになっています。

札という漢字も正確に読めないようです。
札は“ふだ”もしくは“さつ”と読みますが、札は“さつ”としか読めないようです。「神社のお札は」を“神社のおさつは”と読んでいました。

ニュースを読み上げ機能で聴いているので、一番耳にするのは国の名前、米国です。
米国の米は“こめ”、“まい”、“べい”と3つの読み方があります。
読み上げ機能は米国は“べいこく”と読めて、欧米も“おうべい”と読みました。
非米側は“ひべいがわ”と読めるのに、非米化は“ひこめか”と読んでいました。
試しに非米だけで読み上げてみると“ひこめ”と読みました。

親米は“おやまい”と読み、米バイデン大統領は“こめバイデン大統領”と読みあげたので、思わず吹きそうになりました。

親米を“おやまい”と読んだので、親についても調べてみました。
親露、親中、親密はどれも“おやつゆ”、“おやちゅう”、“おやみつ”とどれも“おや”と読み上げました。これはもしかしたら親=おやの設定になっているのかもしれません。
親露を“おやつゆ”と読んだということは、露も“ろ”と読み上げる設定ではないのかもしれません。

米をお米で検索して出てきた言葉を読み上げてみると、近江米は“おうみまい”と読みました。
文章を読み上げてもらおうと、「価格帯で選ぶお米、米関連の」を選択して読み上げ機能を使うと、“価格で選ぶおこめ、べい関連の”となりました。
やはり、文章の脈絡から読み方を判断しているわけではないようです。

近江米や米国のように1つの言葉になっているもの、もしくは1つの言葉であると読み上げ機能が解釈している言葉は正確に読めますが、非米のように読み上げ機能が認知していない言葉は間違った読み方をするようです。

英語では単語と単語の間にはスペースがあり、“不・無・非・未”のような言葉を使う時は一定のルールがあります。
英語には漢字と平仮名とカタカナのように文字がいくつもありませんが、まさか米という漢字が“お米”と“アメリカ”を指しているとは思わないでしょう。外国人からすると意味不明です。
日本語のように“米関連の”とくっつけることはなく、“米 関連 の”とスペースがあります。
“関連 の”はさておき、米関連という書き方は日本語独特かもしれないなと思いました。

外国語を勉強するときは、学校でも“読み書き”と“聞く話す”の大きく2つに分けて勉強しました。
旅行やビジネスでのコミュニケーションを考えると“読み書き”よりは“聞く話す”の方が実践的なので、“聞く話す”を優先的に勉強するのではないかと思います。
日本語のように同じ漢字でも違う読み方があり意味が異なるのは非常にややこしいので、“読み書き”は後回しになりそうです。

リスニングの教材で勉強しているときは問題ありませんが、「より実践的に、日本のニュースを日本語で聴き取ろう。」と日本のニュースを日本語で読み取り機能を使ってリスニングすると訳がわからなくなるでしょう。

日本のメディアのアメリカに関連するニュースを聞いているのに、“こめ”が出てきたり“まい”が出てくれば、読み書きが出来ない外国人には理解不能となりそうです。

AIが読み間違えているのを聴いていて、改めて日本語の難しさを実感しました。
ルールはあってないようなもので、文章のリズム感や感覚が重視されているように思います。
米バイデン大統領も、アメリカのバイデン大統領と書けば読み取り機能は正しく読み上げることができるのに、“米バイデン大統領”と書くから“こめバイデン大統領”と読んでしまいます。

書き手は“アメリカのバイデン大統領”では言葉が長く、ダラダラしているように感じたのかもしれません。記事の最初に1回“アメリカのバイデン大統領”と書いておけば、それ以降は省略して“米バイデン大統領”と書いても日本人は理解できますし、最初に“アメリカのバイデン大統領”と書かなくても、“米バイデン大統領”の米を“こめ”とは読まないでしょう。

このように感覚で成り立っている日本語をAIが正しく読める日が来るのでしょうか。
僕は難しいんじゃないかと思います。
そして感覚を重視できる言語であるからこそ様々な感情の表現ができることから、日本語の使い方をAIに寄せる必要はないと思います。

AIによって言葉の壁がなくなると言われていますが、日本語だけは手動で修正をしないと意味が変わってしまう箇所が出てくるでしょう。
AIが正しく読めない言語である日本語はAIが普及していった時に、“アナログ”の大切さを伝えられる存在となりそうです。

化粧品研究者こまっきー

↓こちらへどうぞ↓

www.komacky.com