データサイエンスとは?ビッグデータとの関係からビジネスでの生かし方まで

近年さまざまなシーンで聞かれる「データサイエンス」とは、具体的にどのようなジャンルなのでしょうか。IT技術やデータ研究の目覚ましい進歩は、集積されたビッグデータを活用するAIなどを通して、人々の暮らしをどんどん豊かに変革しています。意外と身近に存在するデータサイエンスの価値を、データ分析との違いや、データサイエンス市場の現状などから読み取っていきましょう。

baseballstadium

データサイエンスとデータ分析との違い

大量の情報の集合体であるデータを扱うアプローチとして、データサイエンスだけでなくデータ分析(データアナリティクス)というものもあります。両者の違いを比較することで、近年話題の領域であるデータサイエンスの定義を明らかにしていきましょう。大手の企業や組織が実際に経営に取り入れているこれらの手法には、中小企業や個人事業主にも役立つマーケティングや事業改善のヒントが詰まっています。

データ分析とは

まずデータ分析は、データを規則に基づいて処理し、データの中に存在する特定の情報を抽出し状況改善などに有効活用することを指します。主にデータの現状を分析対象として、選び出した情報を元にビジネスにおいては購買行動、ウェブサイト利用者の行動の改善などを行います。

たとえば、店舗で商品Aを買う人と商品Bを買う人のデータを集め、データ分析の結果、AとB両方を同時に購入する人が一定割合いるという事実が判明したとします。片方しか買っていない人にも両方買ってもらえれば売上が伸びるため、AとBを近くの売り場で販売する、あるいは片方を買った人にセット購入の割引を提供する、といったマーケティング施策を採ることが考えられます。このようにデータ分析は、現状を分析し、状況改善に役立てることが可能です。

データサイエンスとは

一方、データサイエンスは、大量のデータから有益な知見を導き出すことを指します。データ分析と比較して、データサイエンスはビッグデータと呼ばれる大規模かつ複雑なデータを扱うケースも多く、統計学やアルゴリズム、情報科学、数学、機械学習などの知識が求められます。ビジネスだけでなく、都市設計や交通、行動科学、社会学、医療などさまざまな分野でデータサイエンスのアプローチが役立てられています。

データサイエンスを効果的に使い、巨大スタジアムのスポーツ観戦チケットの売れ方というデータを用い、1人席が余ってしまうことによる機会損失を減らしたという例があります。会場のあちらこちらに点在して売れ残った1人席は、グループ客には売れず、「チケットが欲しい人がまだいるにも関わらず複数人が座れる席がない」といった需給の不一致が、双方にとってデメリットをもたらします。それを防ぐためにチケットの売れ方というビッグデータが注目されました。座席を選ぶ、空席を提供するという双方の行動をデータサイエンスの手法で解析し、その結果を基にシステムの改善を行い、より効率的に、より多くの人が適したチケットを購入できるようになったという好例です。

この例からもわかるように、ただ特定の情報の多い・少ないだけでなく、行動パターンの情報、好みの情報など、シンプルな数値では表しにくい複雑なデータを対象とすることが、データサイエンスの特徴です。

internet

データサイエンスが生まれた背景

データサイエンスは近年注目を集めるジャンルですが、用語としては古くから存在し、デンマークのコンピューター科学者ピーター・ナウアが1974年に自著の中で使ったことが知られています。次第に統計学の分野などで現在のデータサイエンスの定義が明確化され、そこからじわじわとアカデミアからビジネスの場へと広がっていきます。

データサイエンスはコンピューターの発展と複雑化に伴って成長してきました。同時に、複雑化する世の中の仕組みや、インターネットの発達もデータサイエンスの成長と活用範囲の拡大に寄与しました。データを基に世の中を快適に、最適化していくために、データサイエンスの発展は必至だったといえます。

参考:A Very Short History Of Data Science(2013年5月28日、Forbes)

最近ではIT企業だけでなく、さまざまな業種でデータサイエンスの専門家が活躍しています。特に日本でも2010年代に入ってデータサイエンスの需要が増えてきたため、データサイエンティストの育成や、専門知識がない人でもデータ活用ができるシステムの開発なども進んでいます。

sushi

国内におけるデータサイエンス市場の現状

日本国内においても、既に日常レベルでのデータサイエンスの活用が本格化しています。医療や介護の現場で高齢者の歩行行動をデータ化して転倒などの事故防止につなげたり、排泄や徘徊といった行動をデータとして記録しスタッフの見回り回数や人員配置に役立てたりするなど、データサイエンスのお陰で仕事が簡略化されたり、人命の安全度が高まるなど、もはや生活に欠かせない存在です。

データサイエンスではあくまでデータとして個人を特定しない形で情報を解析することもできるため、プライバシーの観点からも活用の場はどんどん広がっています。

仕事の省力化、効率化

データサイエンスを仕事の省力化、効率化のために生かしている例があります。その一つがチャットボットと呼ばれる、AI(人工知能)を使った自動コミュニケーションシステムです。オンラインでのチャットは従来、ヒト対ヒトで行うものでしたが、これをヒト対AIで行うことでカスタマーサービスなどの業務を効率化するのがチャットボットです。ホスピタリティー業などでの導入が進んでおり、チャットボットの画面で質問を入力すると、AIが最適な回答を探し出し提示してくれます。

チャットボットはシステム設計として、過去のヒト対ヒトの問い合わせのコミュニケーション例などをデータサイエンスで分析し、その結果から導き出された適切な回答を提示するように組み込まれています。たとえばホテルの予約客がホテルのチャットボットに「ホテルの電話番号を教えてください」と質問した場合、AIは「ホテル」「電話番号」などのキーワードや文脈を過去データと照合し、似た質問の場合に求められていた答えを見出し、提示します。頻出する質問や簡単な文章には対応している反面、過去に例がなく複雑なものには正確に答えられないため、人間のオペレーターとの会話に誘導することになります。とはいえ、オペレーターの手を煩わせるまでもない簡単な質問はチャットボットが解決してくれるため、顧客側は短時間で、営業時間外であっても欲しい回答を得ることができ、ホテル側はオペレーター業務を省力化でき、これまではオペレーターの記憶や現場の記録に頼っていた情報の管理もしやすくなり、双方にメリットがあります。

さらに、チャットボットで回答できた内容、できなかった内容もさらなるデータとして蓄積し、データサイエンスを活用してシステムの改善に生かすことで、より高度な質問に答えられるようAIを高度化することが可能です。

資源の節約

回転寿司店のレーンに乗せる皿に電子タグを付け、時間帯、曜日、ネタの種類などの情報を収集し、集まったデータを基にデータサイエンスを駆使して寿司の廃棄を減らしたという実例もあります。時間や曜日で異なる客層ごとに、好まれるネタをもっと多くレーンに流せば顧客の満足と売上の向上につながるため、データを仕入れにも反映させ、無駄を減らしてコスト効率を上げ、結果的に経営改善になります。

従来はスタッフの勘や予想という不確かな情報に従って提供していたネタや仕入れが、データサイエンスによってシステム化できるため、スタッフの入れ替わりや人手不足にも対応できる他、複数店舗のデータを集めれば新店舗でその知見を生かすこともできるかもしれません。

データサイエンス活用のポイント

データサイエンスがいくら発達しても、先述の介護現場やチャットボットの例のように、やはり人間の力がなくてはビジネスも生活も立ち行きません。データサイエンスはあくまで人間の活動をサポートするものであり、それ自体が主体ではないことを認識しておく必要があります。

それは同時に、人間の能力が求められるシーン、人間でなくては対応できないシチュエーションにこそ、人間本来の仕事が存在するということでもあります。データサイエンスができることはデータサイエンスに任せ、人間にしかできないことに集中することで、よりクオリティーの高い仕事やサービス提供ができると考え、日常の中のデータサイエンスを上手に活用していきましょう。

執筆は2019年7月20日時点の情報を参照しています。
*当ウェブサイトからリンクした外部のウェブサイトの内容については、Squareは責任を負いません。
*Photography provided by, Unsplash

関連記事
客効果の分析は必須?データから集客方法を検討しよう!
バスケット分析とは?レシートから解るマーケティングデータで販売を強化する方法