Microsoft MAI-Image-2発表──テキスト描画とリアリズムが大幅進化したAI画像生成モデル
Designer、Copilotに搭載。AI画像生成の新たな選択肢が登場

Microsoftは自社開発のAI画像生成モデル「MAI-Image-2」を発表した。従来のDALL-E依存から脱却し、独自のアーキテクチャで開発されたこのモデルは、特にテキスト描画の正確性とフォトリアリスティックな画像生成の品質で大きな進歩を遂げている。Microsoft Designer、Copilot、Bing Image Creatorに順次搭載される予定だ。
テキスト描画とリアリズムの飛躍
MAI-Image-2の最大の特徴は、画像内のテキスト描画精度だ。看板、ロゴ、ポスターなどの画像を生成する際、従来のモデルでは文字が崩れたり読めなかったりする問題があったが、MAI-Image-2では英語・日本語を含む20以上の言語でほぼ正確なテキスト表示を実現した。また、人物の肌質感、光の反射、布の質感など、フォトリアリスティックな表現力も大幅に向上。プロの広告やデザインの現場で実用レベルに達したとMicrosoftは自信を見せている。
POINT
MAI-Image-2は生成速度も改善。1024x1024の画像を平均3秒で生成。Copilot ProユーザーはAPIアクセスも可能。
AITAKE編集部の見方
Microsoftが画像生成で自社モデルに舵を切ったことは、AI画像生成市場の勢力図を変える可能性がある。これまでOpenAIのDALL-Eに依存していたMicrosoftだが、MAI-Image-2でその関係にも変化が生じるかもしれない。Midjourney、Stable Diffusion、DALL-E、そしてMAI-Image-2と、選択肢が増えることはユーザーにとって歓迎すべきことだ。特にテキスト描画の改善は、ビジネス用途でのAI画像生成のハードルを大きく下げるだろう。
Source: Microsoft
関連レビュー