生成AIは建築設計をいかに変容するか
- 建築家やデザイナーは、テキストから画像を生成するAIプログラムを使い、既存の画像やテキストコマンドから写実的ななデザインコンセプトを素早く作成している。
- Midjourney、DALL-E、Stable Diffusionなどのプログラムが生成する2D画像を、建築家はイテレーションにより洗練させ、クライアントの承認を得たり、さまざまな設計オプションを検討したりしている。
- 将来のAIアプリケーションは、3Dモデルのサイズを生成レンダリングに取り込んだり、現地の建築基準法を解釈したり、3Dモデリングプログラムの画面のレコーディングをリアルタイムレンダリングに利用したりするなど、よりコンテキストに特化したものになる可能性がある。
世界各地の建築事務所で重大な変化が起きており、それが音も立てずに実現している場合も多い。既存の画像と簡単なテキストコマンドを使ってデザインコンセプトの生成を数秒で作成、調整できる、AIドリブンな画像生成プログラムが登場している。
デザインコンサルタント会社Geniantのダラス・オフィスでパートナーを務めるジョサイア・プラット氏は「史上最大の規模とペースで、急速に加速しています」と話す。「暴露された秘密のようなものであり、ここまで拡散されたのでは、もう再び隠すことなどできないでしょう」。
例えば建築家が、マスティンバー工法による中層ビルの外観を、さまざまな高さや木々に囲まれた形、さらには高倍率のキヤノンRFカメラのレンズを通して、午後の遅い時間帯に太陽の光を浴びた状態でどう見えるのかを調べたいとしたら? いまやGeniant、Ankrom Moisan、MVRDVといった企業は、従来のソフトウェアツールを用いてジュニアアソシエイトやグラフィックデザイナーにシナリオを用意させる代わりに、Midjourney、DALL-E、Stable Diffusionなどのテキストから画像を生成するAIプログラムを利用して写実的な2D画像をレンダリングするようになった。
ポートランドを拠点とするAnkrom Moisanでアーキテクチャデザインディレクターを務めるマイケル・グレート氏は、十分なデザインボキャブラリーを持つ建築家やデザイナーであれば、Midjourneyなどの画像生成プログラムに参考画像を一点アップロードし、厳選した説明文を幾つか入力することで、素材の選択やマッスの配置、部屋や機能の選択、採光パターンなどを試行錯誤するための何百ものレンダリングを数時間で作成できると話す。「こうしたバリエーションを極めて迅速に作成し、それをクライアントに提示して、どちらの方向性が良いとお考えですか?と尋ねられる、ということなのです」。
Ankrom Moisanはこの1年で、少なくとも5件の商業プロジェクトにMidjourneyを利用している。そのひとつが、カリフォルニア州北部の大規模な集合住宅プロジェクトだ。現地の法規制を反映し、また、建築家でありプランナーでもあったアル・ボークが1960年代初頭に都市開発した、サンフランシスコから北に100マイル離れた海岸沿いのコミュニティ、シーランチの建築様式を模倣したいというクライアントからの要望を満たすため、このツールが活用された。レッドウッドとガラスで覆われた構造体の鋭角的なラインを広大で自己完結型の集合住宅に変換することは難題だったが、Midjourneyはそれを上手くやってのけた。
Ankrom Moisanシニアアソシエイトのラミン・レズヴァニ氏は「プロジェクトの特色とデザインコンセプトのすべてを、クライアントが理解しやすく、また私たちが目指す感情や雰囲気、審美的要素を喚起するひとつのイメージに素早く結びつけられるようになったことは、極めて重要です」と話す。
最新版であるMidjourney v6のレンダリング画像は驚くほどシャープであり、これがレンダリング画像だと知らないクライアントに、物理世界に実際に存在する建物だと信じ込ませるのに十分なクオリティだ。こうしたイメージは、デザイン分野や時代を超えたスタイルを描いたり、あるテーマを拡大させるよう操作したりできるため、啓示的な発見につながることもある。
新たなボキャブラリーを享受する
アーティスト、学際的デザイナー、建築家のハッサン・ラガブ氏は、カリフォルニアを拠点とする建設会社Martin Bros.で4年にわたりコンピュテーショナルデザイナーとして従事し、ロサンゼルスの博物館Lucas Museum of Narrative Artの複雑に表現された部分のモデリングと製作を行った。2022年の夏、彼は「新しい建築ボキャブラリー」を生み出し、「AIがエジプトの遺産都市をどう理解するのか」を探求する技術ツールとしてMidjourneyを使用するようになった。
彼の作品は瞬く間に広まり、それが映画スタジオのブランディング、建設現場でのAIの応用に関する講演、アラブ首長国連邦シャールジャ市で開催された写真展Xposureなどへの出演につながった。彼とMidjourneyとの関係は複雑だ。「建築家としては自分でコントロールしたいと考えますが、Midjourneyではコントロールは重要ではありません」と、ラガブ氏。その一方で、この分野の表現力の限界を模索することができる。「新しいことを探求したいなら、そうするしかありません。建築家という枠から飛び出さなければならないのです」。
「ザハ・ハディドをザハたらしめたのは、彼女がロシアの前衛芸術家カジミール・マレーヴィチにインスパイアされていたからです」と、ラガブ氏。「彼女は建築家的思考から自らを解き放ち、それがイノベーションをもたらしました。それは、あらゆる建築家にとって同様です。カラトラバ、ガウディ、そしてゲーリー。皆がそうして限界を打ち破りました。テクノロジーで、建築を新しい世界へと導くのです」。
画像生成アプリケーションは、より実用的な機能を果たすこともできる。「チームのジュニアグラフィックアーティストが傍に座っていて、いつでも頼み事ができるようなものです。“目覚まし時計をレンダリングしてくれるかな、黒い背景で”といった具合に」と、プラット氏は話す。
細部が違いを生み出す
Midjourneyのセールスポイントのひとつが、そのアクセスのしやすさだ。プログラムに説明的なフレーズを幾つか入力するだけで、初心者でも写真のようにリアルな建物のレンダリング画像を生成できる。だがプロジェクトのパラメーターを反映した、クライアントに役立つような、ビジネスに使えるイメージを作成するには、流暢なボキャブラリーと技術的な理解力、そして大抵はかなりの試行錯誤が必要になる。
「ストーリーテリングという点では、できる限り描写的であることが重要です」と語るシカゴ北郊の建築事務所Stephen Coorlasプレジデントのスティーブン・クーラス氏は、YouTubeでMidjourneyを使ったワークフローを公開しており、「AIと会話できる人」と呼ばれている。彼は「映画的な写真で、60ミリのカメラを使っており、嵐の午後、モダンな内装のログハウス。黒がアクセントで、環境光あり…」というように、アドリブでプロンプトを出す。
ここでも、結果を大きく左右するのは細部だ。望ましい効果を得るには、プロンプトをカメラの種類、雰囲気、時間帯、視点位置に応じて調整する必要があると、クーラス氏は話す。その他のテクニックには、優先順位に基づいた単語の語順や、特定の単語の重要度を他の単語に優先させてコントロールするための文字コマンドの追加などがあり、これらが結果に大きな影響を与える可能性がある。
ラガブ氏は、プロンプトの技術をスケッチに例えている。スケッチは、核となるアイデアから始まり、より細かなアイデアへと絞り込んでいく反復プロセスだ。「一度にすべてを行おうとしない方がいいでしょう」と、ラガブ氏。「最初のストロークから始め、それを何層にも重ねてバリエーションを加えるのです」。
とはいえ、建築物がどう設計、製造、建設されるかを深く理解している手練れの建築家やコンピュテーショナルデザイナーでも、ツールが理解できることや表現できること、そのサイズや部品レベルには大きな限界がある。例えば「合わせ梁、メタルファスナー、通しボルトを使用した木材接合のディテール」をレンダリングするには、どうしたらいいでしょう?と、クーラス氏。「自分のビジネスに統合できるかどうかという点で、あちこちに行き止まりがあります」。
限界を理解する
レズヴァーニ氏は、Midjourneyで作成されたレンダリング画像は、今のところは感じの良いイメージに過ぎないと話す。このプログラムでは、サイズ精度の高いモデル、3D深度マップ、設計/施工図を作成することはできない。Midjourneyで作成されたレンダリングは人工物であり、そのレンダリング画像をモデリングソフトウェアで3D環境に変換することはできないのだ。だがMidjourneyは、これまで想像もできなかったスピードと多様なスタイルでコンセプトイメージを生成することが可能だ。
それを苦々しく思う人もいる。「アーティスト、科学技術者、デザイナー、建築家の中には、登場しつつあるこうしたAIツールセットを毛嫌いする人たちもいます」と、プラット氏。「なぜなら、これは新しい芸術のように思えるものの、実際には既存の芸術の極めて派生的なものを生み出せるアルゴリズムを作り出していることになるからです」。
テキストから画像を生成するAIプログラムを警戒している実務家は、コスト削減、制作スピードの向上、デザイン決定に大きな影響力を求めるクライアントへのアピールのために、ワークフローに画像生成ソフトウェアを導入している技術導入に前向きな企業に対抗するべく、適応する必要があるかもしれない。Midjourneyが拡散モデルとアーキテクチャ機能に磨きをかけるなか、PromeAI、Look X、Finch 3D、ControlNet、Comfy AI、Stable Diffusionなど最近開発されたAIプログラムやプロトコルは、AIによる画像生成の限界をさらに押し広げようとしている。
建築家やコンピュテーショナルデザイナー向けに開発されたこれらのツールは、作業中の3Dモデルのプロポーションサイズを生成レンダリングに取り入れたり、現地の建築基準法を解釈したり、テキストベースのインターフェースコマンドを使用したリアルタイムレンダリングの基礎としてAutodesk 3ds Maxなどの3Dモデリングプログラムからアップロードされた画面録画を使用したりすることで、画像生成をよりコンテキストに特化させる方法を提供すると、ラガブ氏は話す。シドニー・オペラハウスのダイナミズムを建物に反映させたい? プロンプトフィールドに命令を入力し、モデルが360度回転する様子を見ればいい。
「『ビルが必要だ。建設予定地はここ。そして、これが私が好きなアーティストや建築家だ』と言うだけで、そうした[建築基準法に準拠する]建造物が得られる未来が実現します」と、プラット氏。「ありとあらゆる材料、ボルト、何もかも…。その計画用の都市計画書類が出来上がります。必要事項を入力するだけ。それが80階建てでも問題ありません。こんなことが実際に起こりつつあるのです」。