「Python」「R」「Jupyter Notebook」「Tableau」「Keras」が愛用される理由経験豊かなデータサイエンティストのお墨付き

企業の取得データが急増している近年では、情報を全て把握するためにもデータサイエンスツールが欠かせない。本稿では「Python」「R」「Jupyter Notebook」「Tableau」「Keras」について、データサイエンティストが愛用する理由を聞いた。

2019年02月12日 05時00分 公開
[Ericka ChickowskiTechTarget]

 データと分析は、デジタルトランスフォーメーションやデジタルディスラプション(デジタル時代の創造的破壊)を引き起こすガソリンになる。そして、企業がこのガソリンをハイオクに変える方法は1つしかない。それは、統計学者、数学者、ビジネス分析専門家のチームに適切なデータサイエンスツールを提供し、増大し続ける企業データのプールから洞察を引き出すことだ。

 純粋な統計分析、機械学習のモデリング、視覚化など、その用途が何であれ、データ駆動型のビジネス文化を発展させるには強力な一連のデータサイエンスツールが欠かせない。

 さまざまな業界に身を置く多数の経験豊かなデータサイエンティストと情報交換を行い、各自が最も使用しているツールについてインタビューした。本稿では、その中で何度となく名前が挙がった上位5つの厳選されたツールを紹介する。

1.Python

 カスタムアルゴリズムを作成するプログラミング手法に比べて個々のソフトウェアはそれほど多くない。多くのデータサイエンティストに人気があるのは「Python」だ。データマイニング系情報サイトKDnuggetsが、2052人のユーザーを対象に最近実施した、分析とデータサイエンス用ソフトウェアの調査では、65.6%の回答者が最高評価を付けるツールとしてPythonを挙げた。

 データ分析プラットフォームベンダーCindicatorでリードデータサイエンティストを務めるアレクサンダー・オスピアンコ氏は次のように語る。「データサイエンスとバックエンドの両方にPythonを使用している。そうすれば、迅速な開発と機械学習モデルの導入が可能になる。導入済みツールのセキュリティを確保する上でもPythonは非常に重要だ」

 データ分析サービス企業Civis Analyticsのケイティ・マローン氏はもともと素粒子物理学者だったが、後に同社でデータサイエンスリサーチチームの共同責任者になった。ケイティ氏は「物理学者時代にお気に入りだったデータサイエンスツールのPythonをビジネスの世界でも引き続き使用している」と話す。同氏にとって特に魅力的なのは、Pythonを取り巻く強力なオープンソースエコシステムだ。多様なデータサイエンスライブラリが提供されおり、特定の分析問題を解決するのに役立っている。

 「Pythonを使用してデータサイエンスの興味深い問題を解決しようとするオープンソース開発者のコミュニティーは、実に活気にあふれている」(マローン氏)

 予測分析ソフトウェアベンダーWovenwareでイノベーションディレクター兼リードデータサイエンティストを務めるレスリー・デゼズス氏も同じ意見だ。同氏はPythonライブラリを非常に頼りにしている。

 「オープンソース『Scrapy』などのPythonライブラリを使用している。Webスクレイピングを実行し、インターネットからデータを抽出してそれを分析用としてデータフレームにアップロードできるからだ。データ分析と行列演算にはPythonライブラリの『Pandas』と『NumPy』を使っている。どちらも素早くコードを作成するのに便利だ。NumPyでは複雑なブロードキャスト機能を実現できる」(デゼズス氏)

 マーケティングや顧客分析ツールを提供するTiger Analyticsで、データサイエンスおよびイノベーション部門の責任者を務めるニランジャン・クリシュナ氏の説明によると、Pythonのユースケースは非常に多彩だという。

 「Tiger AnalyticsではPythonデータサイエンスモデルの導入に成功しているが、それは消費者直結型マーケティングキャンペーンや生命保険業を最適化するのが目的だ。オンライン広告のリアルタイム入札を改善するためでもある」(クリシュナ氏)

 Pythonには明確な欠点もある。Pythonがコードベースであり、使用するには高度なプログラミングスキルと分析スキルが必要になることだ。

 「とはいえ『KNIME』や『Alteryx』という、メニュー方式でコードの少ない素晴らしい代替手段がある。これらはシチズンデータサイエンティストやビジネスアナリストでも使用できる」と同氏は語る。

2.R

ITmedia マーケティング新着記事

news148.jpg

天候と位置情報を活用 ルグランとジオロジックが新たな広告サービスを共同開発
ルグランとジオロジックが新たな「天気連動型広告」を共同開発した。ルグランが気象デー...

news130.jpg

“AI美女”を広告に起用しない ユニリーバ「Dove」はなぜそう決めたのか
Unilever傘下の美容ケアブランド「Dove」は、「Real Beauty」の20周年を機に、生成AIツー...

news099.png

有料動画サービス 34歳以下では過半数が利用経験、4割は1日1回以上利用
「ニールセン・ビデオコンテンツ アンド アド レポート 2024」を基に、テレビ画面での動...