コース: 人工知能(AI)の基礎:機械学習
今すぐコースを受講しましょう
今すぐ登録して、24,900件以上登録されている、業界エキスパート指導のコースを受講しましょう。
k平均法とは
k 平均法も、 よく使われるアルゴリズムです。 名前が似ていることから、 しばしば k 近傍法と混同されがちな アルゴリズムですが、 その中身はまったく異なります。 k 近傍法は、 既知のデータに基づく教師あり学習で データを分類する 機械学習アルゴリズムです。 これに対し、k 平均法は、 機械が訓練データによらずに データを解析して クラスターを生成するという、 教師なし学習のアルゴリズムです。 前にも紹介したシカゴの動物保護施設には、 収容している犬が集まって一緒に遊べる、 大きな交流室がありました。 犬たちは人間のように、 気の合う仲間と楽しく過ごします。 毎日決められた交流の時間になると、 仲間同士が自然に集まるのです。 例えば、この施設が 閉鎖されることになって、犬たちを周辺の 複数の施設に移すことになったとします。 各施設と相談した結果、 犬への負担を少しでも軽くするために、 仲間同士のクラスターで 分ける方針が決まったとします。 すべての犬を、 3つのクラスターに分けます。 仲のいい犬で3つのクラスターにする という数字の3が、 k 平均法で使う k 値です。 アルゴリズムをスタートさせると、 機械がすべての犬の中から ランダムに3匹を選び出して、 赤、黄、青の3つの色を割り当てます。 3つの色は、犬同士の仲間関係に 基づくクラスターを表し、 この3匹が初期の中心点になります。 次に、3匹それぞれを基準にして、 ほかのすべての犬との 平均的な距離を求めます。 その上で、3匹それぞれから見て 距離が近い順に、 同じ色の首輪をつけていきます。 中心点がランダムに選ばれているので、 きれいなクラスターにならないことも 多々あります。 この3匹は 一緒の仲間だったかもしれません。 その場合、この3匹から見た大部分の 犬との距離は、かなり遠くなるでしょう。 そこで機械は、何度もやり直しながら 最適な中心点を探していきます。 中には、クラスターを1つずつ 調べるアルゴリズムもあります。 中心点を変えつつ、 すべての犬との距離を確認していくのです。 中心点が見つかれば、 新しい犬のクラスターを 見きわめるのも簡単です。 新入りの犬も、 ほかの犬たちと一緒に交流室に入れ、 中心点にあたる犬との距離を測れば、 どのクラスターになるかがわかります。…
エクササイズファイルを使って実践してみましょう。
インストラクターがコースで使用しているファイルはダウンロードできます。見て、聞いて、練習することで、理解度を深めることができます。