NEWS

高麗(コリョ)大学のJ.H.LEE(イ・ジンヒョック)博士、Princeton(プリストン)大学と自然言語処理する人工知能開発… リアルタイムで質疑応答するモデル「AI DensePhrases(デンスフレーズ)」

2021-08-09    hit . 60335


プリストン大学のDanqi Chen(ダンチ・チェン)教授と高麗大学のJ.H.LEE(イ・ジンヒョック)博士

2021.08.07 18:07

高麗(コリョ)大学のコンピューター学科のJ.W.KANG(カン・ジェウ)教授チームがPrinceton University(プリストン大学)の
Danqi Chen(ダンチ・チェン)教授と共同研究を通じて500万件を超える文書に対した自然言語質疑の答えを
リアルタイムで探してくれる人工知能(AI)モデルを開発した。

「DensePhrases(デンスフレーズ)」と呼ばれるこの人工知能は英語ウィキペディア500万件以上の文書に対する
ユーザの自然言語質疑を100ms(0.1秒)内外に処理する。

このモデルは既存最高性能のモデル並みの性能を維持しながらも20倍を超える速度向上を達成して、
高価のGPUなしにもモデル駆動が可能という長所を持っている。

DensePhrasesはユーザが日常語で作成した質疑に対した答えをウィキペディアで探す。
例えば、「2016年の五輪の男子エペで金メダルを獲得した人(Who did win a gold medal in the men`s epee at the 2016 Olympics)」
という質問をすると、リアルタイムでウィキペディアのFencing at the 2016 Summer Olympicsページから
Park Sang-youngという具体的な答えを探してくれる。

今回の研究はプリストン大学で訪問研究中である高麗大学のJ.H.LEE(イ・ジンヒョック)博士の主導でM.J.SEONG(スン・ムジン)博士課程と
プリストン大学のDanqi Chen教授が参加し、8月1日から6日までオンラインで開催された
グローバル人工知能の自然言語処理分野で最高の権威を誇る「自然言語処理国際共同会議2021(ACL2021)」で8月4日に発表された。

この研究は数年間J.H.LEE博士が主導してきた「句基盤の質疑応答(Phrase-Indexed QA)」と
「オープンドメイン質疑応答(Open-Domain QA)」技術を発展させてきた結果でもある。
この事前研究もまた2019年と2020年に各ACLで発表されて、今年で3年連続で最高権威の学術会であるACLで
その研究の成果を認められることになった。

モデルDensePhrasesの学習には機械読解(Machine Reading Comprehension)のデータセットと
質疑生成(Question Generation)モデルを活用して作られた150万余りのデータが使われて、
モデルとデータセットはGitHub(ギットハブ)で公開されているので誰でも直接体験することもできる。

このモデルはウィキペディアだけではなく、様々なドメインの大容量文書ビッグデータへも適用できるように設計されており、
学界や産業界の様々な分野で自然言語基盤QAプラットホームとして活用できる。

※本件についてお問い合わせ事項がございましら、当ホームページの「お申込み/お問い合わせ」又は下記の連絡先へご連絡お願い致します。
部署名:SEOIL E&M 企画マーケティンググループ
TEL :+82)2-6204-2033
E-mail : pl@seoilenm.com