粘土板の内容を解読したいのに一部欠けてる!(ビキビキ)→人工知能で続きが判るかも!

これすげー頭のいい人工知能の使い方だなと思った記事。古代の粘土板の「欠けてる部分」がどっか別の博物館に収蔵されていないか、データベースから瞬時に探し出すシステムを開発しているという。粘土板は文字どおり粘土の板なので、長年の間に破片になってしまっており、異なる時期に発掘されたり、同じ博物館の中でも収蔵品の中でごっちゃになっている場合がある。また盗掘者が別々の人に破片を売りつけてしまったケースもある。そんなこんなで、元は完品だったのに読み解くことが出来ない…と困っていたところ、なんと今流行りの人工知能やデータサイエンスの力を借りて、欠けている破片を見つけ出せるようにしちゃおう! というシステムが開発されているらしい。

Using artificial intelligence to fill in gaps in ancient texts
Read more at https://archaeologynewsnetwork.blogspot.com/2019/07/filling-in-gaps-using-artificial.html

11.PNG

前提として、人工知能やAIと呼ばれているものは、「何でも出来る」わけではなく、得意なジヤンルと不得意なジヤンルがある。なので、それらに何を任せてやらせるかによって、発揮されるパフォーマンスは全然違ったものとなる。画像マッチングは昔から得意ジャンルなのだが、文脈マッチングで条件分岐で回答を出す、というような作業はむしろ苦手。なので、単純に文章を暗記させてそこからパターンを導き出させる作業をやらせると、あまりいい結果が出ない。
今回のが文脈マッチングで上手くいっているのは、基本的にデータベースに登録されたデータ内にマッチングするものがあるか、ないかを見ているだけで、自分で判断する箇所を限定的にしているからだと思われる。

要するに、「自分で判断して自動でググってくれるシステム」という感じの使い方。

そのため事前に、破損した石板をテキスト化してデータベースに突っ込んでおく必要がある。人間だと手作業で何日もかけてパズルピースを探さなければならないところ、人工知能なら早ければ数秒で回答を出してくれるだろうし、登録されているデータ数が多くなってもパニックになることはない。(ハードウェアの性能次第だが…)

これはほんと頭のいい使い方。

あと楔形文字の粘土板って基本的にオリジナルテキストから何枚も複写するものなので、同じ文章が記載された異なる石板の断片を複数枚ぶん寄せ集めて完品を復元することも出来るはず。たとえば、Aの粘土板に下の3/5、Bの粘土板に上の1/4、Cの粘土板に真ん中の1/3だけ残ってる、という感じで。

あと自動翻訳の検討もなされているようで。
前に見た、画像判定だけで古代の文章を自動翻訳するシステムは開発難しそうだなーと思ってたけど、一回テキストに起こす作業さえできればそこはクリアできそう。翻訳データの学習が進めば、いつか夢の自動翻訳も実装されて、何万枚もの粘土板を数人の研究者が何十年もかけてひたすら翻訳する作業はしなくてよくなるのかもしれないね。いつか。(期待





…やっぱ会社のデータサイエンティスト研修行って来ようかな
なんかこう、ネタになりそうな予感がする(`・ω・´)