今日はトレーニングのご紹介です。

Apache Mahout ではじめる機械学習
http://www.rondhuit.com/services/training/mahout-ML.html

日本で現在、ビッグデータと機械学習とMahout(マハウト)について、これだけの内容を高いレベルで教えてくれるトレーニングはここだけではないでしょうか?

ビッグデータ(Big data)とは、文字通り、データの巨大な集合体です。
身近なところでいえば、
・コンビニを訪れる客が何を買ったか?
・何時にどこからどこまで電車に乗ったか?
・車がいつどこを走ったか?
・メールを誰がどのように処理をしたか?
・Twitterでどのようなつぶやきがあったか?
・ショッピングサイトでいつどのようなものが売れたか?
などなど、挙げたらきりがありません。

機械学習(Machine learning)とは、人工知能の一種で、分類とか人間が持っている学習能力と同様の機能を、コンピュータとプログラミングで実現しようとする技術や手法のことです。つまり、コンピュータが自動的に、膨大なデータの中に潜むパターンや規則性を「モデル化する」ことです。

そして、ビッグデータを基に機械学習を行うソフトウェアがMahout(マハウト)です。

Mahoutで実際にモデル化された情報は、
・これを買ったお客さんにはこの商品もいかがですか?
・迷惑メール判定
・クレジット決済の不正利用の検出
・手書き文字認識
・渋滞予測
・天気予報
などに利用されています。

Apache Lucene/Solrのコミッターであり、「Apache Mahout ではじめる機械学習」を主催するロンウイット社の関口宏司さんは、2012年4月から2年間、北陸先端科学技術大学院大学の情報科学研究科に在籍し、自然言語処理を中心に学習・研究を行い、このトレーニングの核となる部分を学んだ経緯を持っています。

そして、関口さんは、以下のような方にこのトレーニングを勧めています。

  • 今注目の機械学習を体系立てて学び、今後の開発業務に役立てたい方。
  • ビッグデータを保有する企業の情報処理担当者であり、インテグレーターにビッグデータを活用する開発案件を発注するのに必要な最低限の知識を身につけておきたい方。
  • 機械学習系の書籍を購入して勉強したいが、数式が出てきてなかなか読み進められない方。
  • Mahoutイン・アクションを購入してMahoutを使っているが、いまいち使えている気がしない方。

興味のある方はぜひ参加してみてはいかがでしょうか?
詳細については関口さんが書いたブログ、またはトレーニング紹介ページをご覧ください。