考古学は、発掘された遺構や遺物などの現象的な物質を通じて過去を解釈する学問ですが、これまでその方法は主に人間の観察と解析に依存してきました。しかし、今、私たちの歴史の理解を拡大し深化する新たなツールが登場しようとしています。それが人工知能、AIです。
このブログでは、画像生成系AIが考古学的遺物の視覚的な表現を生成する可能性について探求します。AIが遺物を「視覚化」するとどうなるのか、そしてそれが私たちの歴史の理解にどのような影響を及ぼすのかを考えていきましょう。
AIと考古学、一見相反するかのようなこれら二つの分野がどのように交差し、そして互いに影響を及ぼし合うのかについて、一緒に考えてみませんか。これは新しい技術が古代の秘密を解き明かすための冒険、そしてそれが未来にどのような影響を及ぼすのかを考察してみます。
AIと画像生成
考古学的な出土遺物の復元(広い意味で)の可能性を追求するためには、まずAIと画像生成についての理解を深める必要があります。今日、この分野で注目されているのがGenerative AI models、私が普段利用しているものであげると、具体的にはMidjourneyといったサービスです。これらは一種の機械学習アーキテクチャ、Generative Adversarial Network(GAN)を利用しています。
GANは二つのパートから成り立っています。一つ目は新たなデータインスタンス(この場合、画像)を生成する「ジェネレータ」、二つ目は生成されたデータの真正性を評価する「ディスクリミネータ」です。
ユーザーがMidjourneyにプロンプト(Discord上のコマンドを通じて)を入力すると、AIはこのプロンプトを解釈し、ジェネレータが画像の生成を開始します。ジェネレータは、ランダムなノイズ画像から出発し、訓練データから学んだパターンに基づいて徐々にそれを洗練していき、ピクセルごとに画像を生成します。
次にディスクリミネータが、生成された画像を訓練データセットの実際の画像と比較して評価します。生成された画像が実際の画像に十分近い、または”信頼性”があると評価されなかった場合、フィードバックがジェネレータに送られます。ジェネレータはこのフィードバックを利用して、次に生成する画像を調整し、改良します。このプロセスはディスクリミネータが生成画像と実際の画像を見分けられなくなるまで反復されます。
最終的に生成された画像はユーザーに返されます。Midjourneyの場合、AIは一つのプロンプトに対して下のような四つの画像(fig 1)を生成し、ユーザーはアップスケールしたい画像を選択できます。
後述しますが、上の例示画像のように今のところ日本考古学に関する学習内容は少なく、どこか大陸的な、どこかの文明的な内容に引っ張られてしまう傾向が強いです。
※ただし、これは私が翻訳したりした簡易化された説明であり、実際のプロセスはもっとより複雑で高度な技術を含む可能性があります。
考古学的遺物とAI
考古学的遺物のビジュアル再現にAIを用いるというアイデアは、一方で裏を返せば、存在しない遺物を生成する可能性、すなわち「捏造」の危険性を含んでいます。現状では、このような話はSF的な空想に近いものかもしれませんが、もし全ての遺物の3次元形状データがAIに学習される日が来たら。。。。。。この状況は一変するかもしれません。
それを考えると、AIが将来的に考古学的遺物の復元にどのように寄与できるか、またその道筋とは何か、という問いが浮かびます。現在、考古学研究におけるAIの可能性は主に、考古資料の三次元計測データ(3Dデータ)を活用して、形式学的な遺物の分類を行うことを目的としているものが多いように感じます。これは、現象的な遺物の形状、サイズ、テクスチャなどの特性を数値データとして捉え、それを基に遺物の種類や属性、年代などを推定するというものです。
機械学習を用いたこのようなアプローチは、人間の形式学的分類作業を補完し、時には超える可能性を秘めています。考古学者の存在意義が問われますね。それは、AIが膨大な数のデータから複雑なパターンを抽出し、人間が見逃すかもしれない微細な違いを抽出・検出する能力によるものです。
しかし、3Dデータの利用はそのままでは画像生成に直接繋がるわけではありません。画像生成にはさらに精密な3Dモデリングやテクスチャリング、ライティングなどの技術が必要となります。それらの要素をどの程度、そしてどのようにAIが学習・生成できるかは、今後の研究開発が求められる課題となります。
このように、AIが考古学的遺物のビジュアル再現に貢献するためには、遺物の形状や特性を正確に理解し、それを適切な形でビジュアル化するための技術開発が不可欠です。しかし、その一方で、AIが生成するビジュアルが事実を歪める可能性も否定できません。そのため、AIの活用には倫理的な観点からの配慮が必要となります。
遺物記述とAIの挑戦 – 考古学的言説の解釈
遺跡の発掘調査報告書における遺物の表現方法は一般的に、実測図や写真、拓本などの二次元的な表現に加えて、文章や属性表を用いた説明が添えられます。これらの文章は報告書の基盤となる要素であり、遺構や遺物の基本的な内容、図表で示された内容について、正確さと明瞭さ、そして簡潔さが常に求められます。
しかしながら、具体的な遺物事実記載は多様であり、先行事例・先行研究・各都道府県の調査標準や調査担当者の専門領域、恩師・出身研究室の学問的伝統など、多種多様な要素に影響を受けています。これらは日本の考古学において独自に発展してきた、考古学的な言説とも言えるものです。
そこで、これらの一種の考古学的言説が、画像生成AIにどのように解釈されるのか、という問いが浮かび上がります。AIはインターネット上の様々なテキストや画像に基づいて学習しますが、それは人間のように世界を理解するわけではありません。AIが生成する画像は訓練過程で学んだパターンに基づくものであり、人間のように”理解”するわけではないのです。
特定の考古学的遺物を詳細に記述するプロンプトをAIに与えたとしましょう。AIはその説明をある程度視覚的に表現する画像を生成するかもしれません。しかし、生成された画像の正確さは、その説明がAIが学習したデータとどれほど一致しているかに大きく依存します。
さらに、MidjourneyやDALL-EのようなAIモデルは、埋蔵文化財の発掘報告書の遺物事実記載に影響を及ぼす可能性のある微妙なニュアンス、地域の特性、調査担当者の学術的伝統(?)なんかを理解する能力を持っていません。これらは人間の知識や文化の側面であり、AIの訓練プロセスで捉えることが難しい領域です。これらを考慮に入れると、「画像生成AIが考古学的言説をどのように解釈するのか」という問いは、興味深い探求の余地がありますね!!!!よねっ?
未来への展望 – 考古学とAIの融合
画像生成AIが遺跡の発掘調査報告書を元にして遺物の画像を生成するという概念は、現在の人工知能・コンピュータービジョン領域などの科学技術の進歩と共に新たな視点を考古学に提供できると考えます。しかし、その応用は一筋縄ではいかない可能性も含んでいます。
まず、なんだかんだで日本考古学の出土遺物の記述は非常に具体的で専門的であり、さまざまな要素に影響を受けます。遺物の表現には、前述の通り、特定の先行事例や先行研究・都道府県毎の調査標準、担当者の専門性、そして出身大学の学問的伝統などが反映されます。このような特異とも言える複雑さは、AIが直面する挑戦の1つとなります。
さらに、AIモデルが学習するためのデータセットは、一般的にはインターネット上の広範なテキストと画像からなります。このようなデータは、特定の専門分野の知識や、それが地域や学問的伝統にどのように影響を受けているかを完全に反映するものではありません。したがって、AIが考古学的遺物の詳細な記述から画像を生成する能力は、その記述がAIが学習したデータとどれほど一致しているかに大きく依存します。
しかし、こうした問題を克服するための解決策も見えてきます。たとえば、AIの訓練データに考古学的な記述やイメージを組み込むことで、その領域への理解を深めることが可能です。また、画像生成AIのアルゴリズム自体も日々進化しており、より高度な理解と生成能力を持つモデルが今後期待されます。
このような動きを通じて、考古学とAIが互いに補完し、向上する可能性があると言えます。それは新たな遺物の解釈を可能にし、また、その解釈がさらに考古学的な言説を形成し、進化させるかもしれません。このプロセスは、新たな技術が先史・古代の遺物に新たな生命を吹き込むという(よくないこのフレーズw?)、興味深く、重要な可能性を秘めていると考えます。
連載開始。AIと考古学シリーズ
いつまで続くかわかりませんが。このシリーズで考えているのは、まず、「人工知能」(Artificial Intelligence、AI)という用語を定義し、その主要な概念と各種の下位領域、例えば機械学習(machine learning)、深層学習(deep learning)、自然言語処理(natural language processing)、そしてコンピュータビジョン(computer vision)について詳しく解説していきます。次に、考古学(archaeology)との関連について考察します。これは、遺跡の発掘や出土遺物や他の物質的遺物の分析を通じて過去人類の歴史と先史時代・歴史時代を研究する学問分野であることを明らかにします。これまでの伝統的な方法がどのようにして考古学的な発見に重要な役割を果たしてきたかを強調し、これによりAIの統合が画期的である理由を理解する舞台を整えます。少々大袈裟ではありますが。これらの個別のドメインについて基本的な理解を確立した後、AIと考古学がどのように交差するかに焦点を当て、これらをつなげます。AIが大量のデータを迅速に処理し、人間の目が見落とす可能性のあるパターンを検出し、考古学的な発見の識別、分類、分析を補助することにより、考古学の方法を革新する可能性があることを探求します。感性の学問だとか考古学は感性だとかの批判とは別です。このシリーズの具体的項目は、AIツールの考古学的な研究、パターン認識、遺物分析、リモートセンシング(RS)、動植物考古学、遺物の年代測定、倫理的な配慮、ケーススタディ、地理情報システム(GIS)、そして考古学におけるAIの将来の可能性など、今後詳細に考えていきたいと思います。