【東北大発】AIが「自然な英語」を提案し、英語論文の執筆をサポート ラングスミス

【安藤歩美】日本の多くの学生や研究者を悩ませる、英語での論文執筆。ラングスミスは東北大学大学院情報科学研究科・乾健太郎教授が研究する「自然言語処理」技術を応用し、執筆した英文をAIがネイティブに近い自然な英語表現に直してくれるwebサービスを開発中だ。開発を進めるのは、乾研究室に所属する二人の学生。開発者自身が「もはや英語論文執筆に手放せなくなっている」と話すサービスの、開発経緯と展望を聞いた。

AIが英語の「自然な言い回し」を提案してくれる

ラングスミスが開発しているのは、web上のフォームに英文を入力するとスペルミスなどの誤りの指摘だけでなく、ネイティブの表現に近い「自然な言い回し」を提案してくれる英語論文執筆支援システム「Langsmith Editor」。入力した文章を選択するとAIがより自然な複数の英文案を提示してくれるため、自分の伝えたいニュアンスに最も近い文章を選んで修正することが可能だ。

現在ラングスミスのサイト上で無料公開されている「Langsmith Editor」の体験版。文章を入力すると、より自然な言い回しを複数提案してくれる( https://editor.langsmith.co.jp/

人が日常で使う言葉をAIが処理できるようにする技術「自然言語処理」を研究する乾研究室。乾教授はこのエディターを「人間とAIがキャッチボールしながら作る」サービスだと表現する。「AIは基本的に理屈もニュアンスもわかっていなくて、与えられたデータのパターンを暗記しているだけ。だから賢く使うためにはAIに丸投げするのではなく、人とAIがうまくコラボする必要があるんです。人が英文を入力することでAIがより自然な英文を複数提案してくれるこのサービスは、まさに人間とAIとのキャッチボールで作るものだと言えます」

学生だからこそ思いついた「英語論文」のサービス開発

開発を進めるのは、東北大学大学院情報科学研究科博士課程の栗林樹生さんと伊藤拓海さん。乾教授が技術顧問を務めるマシンラーニング・ソリューションズ社から研究室に「学生中心のスタートアップを立ち上げたい」との声がかかり、手を上げたのが二人だった。自然言語処理の技術からどんな事業を生み出せるのか、乾教授と二人は議論を重ねた。

そこで行き着いたのが、学生たち自身が苦労していた英語論文の執筆を手助けするサービスだった。栗林さんは「勘違いが起きやすいテキストでのコミュニケーションを自然言語処理技術で少しでも円滑にできないかと話し合う中で、自分たちだからこそできる分野として『論文』に行き着きました。論文は発見者が査読者にその発見を誤りなく、わかりやすく伝えなければいけませんが、英語論文はそれが難しい。まずはこの分野でサービスを作っていこう、という話になりました」と説明する。

近年、深層学習の大幅な進歩やオンラインで大量のデータが手に入るようになったことで、AIによる翻訳技術は向上し続けている。滑らかで自然な翻訳ができるようになってきた自然言語処理技術を「うまく転用して発展させれば、日本人学生が書いた稚拙な英語の文章を、綺麗な文章に翻訳することはできるのではないかと思っていました」と乾教授は話す。そして「理論上は可能だと思っていましたが、そのアイデアを一生懸命磨き、本当にここまで使えるようになったのはものすごい努力」だと、学生の開発力を称える。

独自技術で、英語論文を書く際の欠かせないツールに

2018年に親会社のマシンラーニング・ソリューションズ取締役の後藤高志さんが代表に就任し、栗林さんと伊藤さんが共同創業者・取締役として就任する形で始動したラングスミス。自然言語処理を生かしたサービスは「分野を絞るほど精度がよくなる」と、まずは学生たち自身がユーザーにもなる工学系の英文に特化したサービス開発を始めた。近年オープンアクセス化が進む工学系の論文サイトから、2020年までに発表された数万点に上る英語の論文データをAIに学習させているという。

AIに自然な英文を提案させるためには「自然な英文」のデータだけでなく、その文章と対応関係が取れる「拙い英文」のデータも同程度必要となる。よって二人は「拙い英文」を擬似的に作るAIも開発。双方のデータを大量に入力することでAIが自然な文章を提案できるようなシステムを作り上げているのが、同社の独自技術だ。

同社は2020年4月に「Langsmith Editor」の体験版をweb上で公開。2021年中には正式に月額課金サービスとしてリリースする計画だ。伊藤さんは「自然言語処理の技術は進化の速度が非常に早く、アカデミアの世界でも最先端を行き続けなければいけない。早くリリースをすればその分ユーザーから多くの英文データが得られるようになるので、より精度が高まりアドバンテージになるはず」と期待する。

すでに開発中の学生二人や乾教授も、自身が英語論文を書く際に欠かせないツールになっている、と笑う。伊藤さんは「同期からも使いたいという声があるし、引き合いを感じる」と、手応えを話す。栗林さんは「工学系の論文から始め、そこから医学、薬学など色んな分野に特化したサービスを徐々に増やしていきたい」と、今後に向けて意気込む。

「大学発ベンチャーの理想的な形になっている」

「まずは開発してきたものが商用化されることが、一番の目標。今回無料版を公開したことで、色んな会社との話も増えてきています。これをビジネスにしていきたい、と思っています」と、伊藤さん。栗林さんは「今はアカデミックに特化していますが、ゆくゆくはいろんな目的で自然言語処理システムならこれだよね、となるようなサービスにしていきたい。AIは今大きな注目を浴びている一方で、自然言語処理はちゃんと事業に結びつくのが難しい現状があります。それをうまく乗り越えた一つのモデルケースになり、色んな人に使ってもらいたいですね」と期待を込める。

乾教授はラングスミス社が、大学発ベンチャーのモデルケースのような存在になるのではないか、と高く評価している。「二人は世界トップレベルのアカデミックな研究もしながら、ベンチャーの立ち上げをしている。大学としては理想的な形で、いいモデルを作ってくれていると思います。我々の技術やアカデミックな研究と社会とのつながりが近くなってきていると思うので、そんなエキサイティングな部分を大学にも取り入れていくことが、学生にとってもわくわくするような経験や大学発ベンチャーの創出につながるのではないでしょうか」

連載:東北大発!イノベーション】2020年、世界大学ランキング日本版の一位になった東北大学。世界最先端の研究が進む東北大では今、その技術力を生かして学生や教職員が起業し、研究とビジネスの両輪で世界の課題解決に挑む動きが盛んになっています。地球温暖化、エネルギー問題、災害、紛争、少子高齢化社会…そんな地球規模の問題を解決すべく生まれた「東北大学発のイノベーション」と、大学に芽生えつつある起業文化を取材します。(毎週月曜日更新)

*TOHOKU360をフォローしよう
twitterinstagramfacebook

>TOHOKU360とは?

TOHOKU360とは?

TOHOKU360は、東北のいまを東北に住むみんなの手で伝える、参加型の"ニュースプロジェクト"です。経験豊富なメディア出身者で構成される「編集者」と、東北6県の各地に住む住民の「通信員」とが力を合わせ、まだ知られていない価値あるニュースを一人一人が自分の足元から発掘し、全国へ、世界へと発信します。

CTR IMG