PR

ChatGPTでデータ分析 効果は?業務の効率化の事例

ChatGPTでデータ分析

ChatGPTは、データ分析に非常に役立つ機能を備えています。以下がその主な使い方です。

データの読み込みと分析

ChatGPTにCSVやExcelファイルなどのデータセットをアップロードすると、そのデータを読み込んで分析することができます。自然言語でプロンプトを入力すると、ChatGPTがPythonコードを生成し、データの可視化、統計分析、機械学習モデルの構築などを行います。

コード生成

データ分析のためのPythonコードを自然言語で指示するだけで、ChatGPTが適切なコードを生成してくれます。pandas、numpyなどのデータ分析ライブラリの使い方も理解しているので、複雑な処理も可能です。

可視化

ChatGPTは、アップロードしたデータから様々な種類の図やグラフを作成することができます。棒グラフ、折れ線グラフ、ヒストグラム、散布図など、目的に応じて適切な可視化を行えます。

説明と解釈

データの統計量や分析結果を自然言語で説明したり、発見事項を解釈したりすることができます。専門用語を使わずに平易な言葉で説明してくれるので、データ分析の初心者でも理解しやすいでしょう。

セキュリティとプライバシー

ChatGPTにデータをアップロードする際は、機密データが含まれないよう注意が必要です。ChatGPTはクラウドベースのAIなので、アップロードしたデータが一時的に保存される可能性があります。機密性の高いデータは避け、匿名化するなどの対策が求められます。

ChatGPTのデータ分析機能は、コーディングスキルがなくても高度な分析が可能になる反面、AIに過度に依存しすぎないよう注意が必要です。人間の判断を加えながら活用することが重要でしょう。

ChatGPTとExcelを連携したデータ分析する方法

ChatGPTとExcelを連携してデータ分析を行う主な方法は以下の3つです。

ChatGPT for Excelアドインを使う
Excelにサードパーティ製のアドイン「ChatGPT for Excel」を追加すると、Excel上でChatGPTのAPIと連携して7つのAI関数を利用できます。データの分析、関数の説明、グラフ作成、VBAコード生成などが可能です。

ChatGPT Plus の Advanced Data Analysis を活用する
ChatGPTの有料プラン「ChatGPT Plus」には、Excelファイルをアップロードしてデータ分析やコード生成ができる「Advanced Data Analysis」機能が付属しています。プログラミングコードの実行や高度な分析が可能です。

ChatGPTにExcelの使い方や関数を質問する
無料のChatGPTでも、Excelの使用方法や関数についての質問に回答してくれます。適切な関数の提案や使い方の説明、データに適したグラフの提案などができます。

Advanced Data Analysisの使い方は以下の通り。

  • Excelファイルをアップロード
  • 自然言語でデータ分析の指示を出す
    例:「このデータの平均値と標準偏差を計算してください」
  • ChatGPTが指示に従ってコードを生成し、結果を返す

ただし、注意点もあります。

  • APIキーの取り扱いには注意が必要
  • 大規模な実装では専門ツールの併用が推奨される
  • ChatGPTの出力は常に検証が必要

ChatGPTとPythonでデータ分析する方法

ChatGPTを使ってPythonでデータ分析を行う方法は以下の通りです。

データのアップロード

まずChatGPTにデータをアップロードする必要があります。CSVやExcelなど、様々な形式のデータファイルをアップロードできます。

データの読み込み

次に、アップロードしたデータを読み込むPythonコードを生成します。例えば以下のようなプロンプトを入力します。

CSVファイルからデータを読み込むPythonコードを書いてください。

ChatGPTがPandasライブラリを使ったコードを生成してくれます。

データの前処理

データの前処理が必要な場合は、以下のようなプロンプトを入力します。

このデータから欠損値を削除し、カテゴリ変数をダミー変数化するPythonコードを書いてください。

ChatGPTが適切なコードを生成してくれます。

探索的データ分析

次に探索的データ分析を行います。以下のようなプロンプトを入力します。

このデータの基本統計量を計算し、変数間の相関係数を求めるPythonコードを書いてください。また、ヒストグラムと散布図行列を描画するコードも書いてください。

ChatGPTがデータの要約統計量を計算し、可視化するコードを生成します。

機械学習モデルの構築

最後に機械学習モデルを構築します。以下のようなプロンプトを入力します。

このデータを使って線形回帰モデルを構築し、決定係数とRMSEを計算するPythonコードを書いてください。

ChatGPTがscikit-learnライブラリを使ったコードを生成し、モデルの性能評価まで行ってくれます。

関連 Pythonの機械学習ライブラリのおすすめ

このように、ChatGPTにデータを与え、適切なプロンプトを入力することで、データ分析の一連の作業をPythonコードで実行することができます。コーディングに不慣れな方でも、ChatGPTの支援を受けながらデータ分析が可能になります。

ChatGPTとCode Interpreterでデータ分析する方法

ChatGPTのCode Interpreter(現在はAdvanced Data Analysisと呼ばれています)を使えば、自然言語の指示だけでデータ分析を行うことができます。以下がその手順となります。

ChatGPT Plusに加入する
Code Interpreterは有料版のChatGPT Plusでのみ利用可能です。

Advanced Data Analysisを有効化する
左側メニューから設定を開き、ベータ機能のAdvanced Data Analysisをオンにします。

GPT-4モデルを選択する
チャット画面でGPT-4モデルを選択します。

データのアップロード
チャット入力欄の「+」ボタンからデータファイル(CSV、Excel等)をアップロードします。

分析の指示
自然言語でデータ分析の指示を出します。

例:

“このデータを使って顧客の購買予測モデルを作成してください。前処理から予測まで全てお願いします。”

実行とフィードバック
ChatGPTがコードを自動生成し、実行します。必要に応じてフィードバックを求められるので、”続けてください”等と返答します。

結果の確認
ChatGPTが分析結果(モデルの精度等)を出力するので確認します。さらに可視化を求める場合は”グラフを描いてください”等と指示します。

ファイルのダウンロード(必要に応じて)
出力結果をファイルとしてダウンロードすることも可能です。

Code Interpreterを使えば、コーディング無しでデータ分析のフルプロセスをChatGPTに任せられます。ただし、出力結果の妥当性は人間が判断する必要があります。

ChatGPTでデータ分析した結果を可視化するには

ChatGPTでデータ分析した結果を可視化するには、以下の手順を踏むことができます。

データのアップロード
まずChatGPTにデータをアップロードする必要があります。CSVやExcelファイルなどの表形式データがアップロード可能です。

プロンプトでデータ分析と可視化を指示
データを分析し、その結果を可視化するようChatGPTに指示します。例えば以下のようなプロンプトを入力します。

“添付したデータを分析し、売上推移を線グラフで可視化してください。”

ChatGPTが分析と可視化を実行
ChatGPTがデータを分析し、指定された形式(この例では線グラフ)で可視化した結果を出力します。

可視化結果の確認
ChatGPTの出力を確認し、適切に可視化されているかをチェックします。必要に応じてプロンプトを修正し、再度可視化を行います。

ChatGPTは高度なデータ分析機能を搭載しており、Pythonなどのコードを自動生成して実行しているため、プログラミングの知識がなくてもデータ分析と可視化が可能です。

ただし、大量のデータや複雑な分析を行う場合は、専用のBIツールやデータ可視化ツールを使うことをおすすめします。ChatGPTは概要を掴むための簡易的な分析に適しています。

ChatGPTでデータ分析まとめ

  • ChatGPTは、データを与えてプロンプト指定することでデータ分析が可能
  • プログラミング知識がなくとも、分析用のスクリプト自体をChatGPTから生成させることで、分析が可能
  • 分析したデータは、簡易的ながらグラフ化など可視化することできる

関連 ChatGPTの使い方