顔で学ぶ「分類」の力:主成分分析とクラスタリング【実践編】

前回の理論編では、「分類」の基本的な考え方と、それを支える代表的な分析手法である主成分分析(PCA)およびクラスタリングについてご紹介しました。

特に、ビジネスシーンにおいてよく直面する「複雑なデータをどう整理し、意味のあるグループに分けるか」という課題に対し、これらの手法が有効であることを、構造的に整理しました。

今回はその応用編として、AI生成の顔画像データを題材に、実際に分類分析を行ってみた結果をご紹介します。

具体的には、8名分の顔画像から128次元の顔特徴ベクトルを抽出し、主成分分析(PCA)により次元圧縮を行ったうえで分類、さらにはクラスタリングによりグルーピングを実施しました。

使用データの紹介

本分析では、AIによって生成された8名の女性の顔画像を対象としています。これらの画像は、以下に掲載しているとおり、年齢や印象の異なる顔が含まれています。

では、これらの顔画像から、どのように「分類」に使えるデータを取り出すのでしょうか?

今回の分析では、顔認識用のAIモデルを用いて、各顔画像から128次元の特徴ベクトルを抽出しました。この処理は次のようなステップで進みます:

  1. 顔画像を読み込む
  2. 顔のランドマーク(目・鼻・口など)を検出
  3. 顔全体の形やパーツの配置バランスを数値化
  4. 128個の数値として出力(=顔の特徴ベクトル)

この128次元のベクトルは、「顔の印象や構造」をデータとして抽出したもので、具体的な意味は説明しづらいものの、輪郭、目鼻立ち、比率、位置関係といった要素が反映されたものと考えられます。

この時点では、抽出の技術的な詳細は置いておくとして、「各顔画像が、128個の数値で表現される属性データに変換された」という点をご理解いただければ十分です。

主成分分析(PCA)による顔情報の整理と可視化

前章でご紹介したように、各顔画像から抽出された128次元の特徴ベクトルは、非常に多次元かつ人の直感では把握しづらい情報です。

そこで今回は、これらの特徴を主成分分析(PCA)によって2つの軸に集約し、顔ごとの違いを視覚的にマッピングしてみました。

このグラフは、横軸を「主成分1」、縦軸を「主成分2」とし、8名の顔画像をそれぞれの座標上にプロットしたものです。

  • 主成分1(横軸)の寄与率:27.7%
  • 主成分2(縦軸)の寄与率:19.2%

この2軸で全体の46.9%の情報をカバーしており、128次元のデータのうち、約半分をこの2軸に圧縮できたことになります。寄与率が高いほど、可視化された情報の“信頼性”も高いとされます。

軸の意味をどう解釈するか?

PCAによって抽出された主成分は、あくまで機械的に計算された軸であり、明確な意味があるわけではありません。しかし、顔画像の位置や傾向を観察することで、おおよその解釈を試みることは可能です。

  • 主成分1(横軸):顔の印象・スタイルの違い
     - 左側(マイナス):ナチュラル、控えめ、素朴な印象
     - 右側(プラス):メイクあり、華やか、都会的な印象
  • 主成分2(縦軸):表情や顔の角度・視線の印象
     - 上側(プラス):真正面で微笑、目力が強い
     - 下側(マイナス):柔らかい笑顔、少し視線が逸れている

このように、抽出された軸を人の感覚に引き寄せて解釈することで、分類の背景にある傾向を読み取ることができます。


解釈の限界と可視化の意義

もちろん、こうした軸の意味づけには限界があります。今回は以下の原因によって、精度が良い分析とならなかったため、結果に疑問を抱く方も多いかもしれません。

  • 主成分2の寄与率はそこまで高くなく、情報量としては主成分1よりも小さい
  • 顔の特徴ベクトルは、目・鼻・輪郭などの形状的特徴を抽出したものであり、人間が理解できる言語的ラベルとは対応していない

しかし、それでもこのように多次元データを低次元に圧縮し可視化することで、「違いの方向性」や「分布の偏り」などの傾向を把握することが可能になります。

クラスタリング結果の可視化 ― 類似する顔のグルーピング

次にご紹介するのは、128次元の顔特徴ベクトルをもとに行ったクラスタリング(階層的クラスタリング)の結果です。見た目は「トーナメント表」のような構造になっており、類似度の高いデータ同士が順にグループ化される過程を示しています。

この図では、8人の顔画像の近いもの同士が段階的にまとめられ、最終的に2つの大きなグループ(クラスター1・クラスター2)に分類されていく様子が視覚化されています。

具体的には:

  • 一番近い(類似している)と判断されたペアが最初に結合
  • それらがさらに近い別のグループと統合され、階層構造(ツリー)が形成されていく
  • 結果として、視覚的に似ている顔の集団が、自然にグループ化されていく

この結果を見ると、筆者は以下のように感じました。

  • 一番近いと判定されたペアは、どちらも「清楚系」の雰囲気を持っているように見える
  • 2番目に似ているのは雰囲気は違いますが、顔は似ているように見える
  • 3番目に近いと判定されたペアは、「華やか・ギャル系」な印象で共通している

もちろん、これはあくまで筆者の主観に基づく印象ではありますが、クラスタリングによって数値的に分類された結果が、感覚的な分類とも一致しているのではないでしょうか。

まとめ

今回は、視覚的に分かりやすい題材として人物の顔写真を用い、「分類とはどういうものか?」を実感していただけるような分析をご紹介しました。

顔の印象という抽象的な情報も、AIの力を使えば数値化し、主成分分析やクラスタリングによって分類・可視化できるという点は、非常に示唆に富んでいます。

実は筆者自身も、過去に需要予測のプロジェクトに携わった際、月別の気温データをもとに、似た気候パターンを持つ地域を分類するという場面で、今回と同じような手法を活用した経験があります。

このように、今回ご紹介した分析手法は、人物の顔に限らず、以下のようなさまざまなシーンで活用が可能です:

  • 地域・店舗の特性分類(マーケティング)
  • 顧客の行動データに基づくセグメンテーション
  • センサー情報などの時系列データのパターン分類
  • 商品の見た目・仕様によるカテゴリ整理 など

「大量の情報を整理し、意味のあるグループを見つけたい」という場面では、分類技術は極めて実践的な武器になります。ぜひ自社の業務や分析業務の中でも、活用を検討してみてください。

コメント