Power BI は、非常に便利なデータ分析および視覚化プラットフォームです。これを使用すると、ビジネス ユーザーは、意味のないデータ レコードからレポートやダッシュボードを作成できます。
これらのレポートとダッシュボードはインタラクティブであり、チーム メンバーと共有できます。このため、Power BI はビジネス インテリジェンスで人気のツールとなっています。
この記事では、Power BI を、データ分析に使用されるもう 1 つの人気のあるプログラミング言語である Python と統合する方法を説明します。
Power BI に Python を統合する理由
Python は人気のあるプログラミング言語であり、比較的習得が簡単であるため、フルタイムのプログラマーでなくてもコードを記述したいデータ アナリストやその他の専門家に好まれています。これを Power BI に統合すると、次のような多くの利点が得られます。
- API を使用してプログラムでデータをインポートできます。これは、リアルタイムの使用状況分析のために Power BI を使用したユーザー データベース システムなど、さまざまなシステムを統合する場合に役立ちます。
- データは、Power BI がネイティブにサポートする方法よりも多くの方法で視覚化することもできます。 Python を Power BI に統合すると、Matplotlib などのライブラリを使用してカスタム ビジュアライゼーションを作成できます。
こちらもお読みください: Microsoft Power BI データ アナリスト認定資格 (PL-300): 取得方法。
早速、Python を Power BI に統合する方法を説明しましょう。
Power BI に Python を統合する方法
Power BI Desktop は Windows 上でのみ実行されます。したがって、このガイドでは、Windows マシンでこれを実行していることを想定します。 Power BI を Python と統合するには、以下に概説する手順に従う必要があります。
Pythonをインストールする
まず、マシンに Python をインストールする必要があります。 Pythonのインストールは簡単です。公式 Python ダウンロード ページにアクセスしてインストーラーをダウンロードするだけです。インストーラーをダウンロードしたら、それを実行し、必ず環境変数に追加してください。その方法がわからない場合は、次のビデオを参考にしてください。
Power BI をインストールする
この部分はある程度明らかです。 Python を Power BI に統合するには、Power BI がインストールされている必要があります。このデモンストレーションでは、デスクトップ バージョンを使用します。これを行うには、まず 公式 Power BI ダウンロード ページ にアクセスし、デスクトップ バージョンをダウンロードします。
ダウンロードした後、デフォルト設定を受け入れてインストーラーを実行します。
Pandas と Matplotlib をインストールする
Power BI では、データセットを操作し、Python で視覚化を作成するために 2 つの追加ライブラリが必要です。これらは、Pandas (データ処理ライブラリ) と Matplotlib (データ視覚化ライブラリ) です。パンダをインストールするには、コマンド プロンプトを開き、次のコマンドを入力します。
pip3 install pandas
次に、コマンド プロンプトに次のコマンドを入力して matplotlib をインストールします。
pip3 install matplotlib==3.7
Python スクリプトを有効にする
最後のステップでは、Python スクリプトが有効になっていることを確認します。これを行うには、Power BI リボンの [ファイル] セクションを選択します。
次に、メニューから「オプションと設定」オプションを選択します。
[オプション] メニューで、[Python スクリプト] セクションに移動し、Python インストール フォルダーが Python フォルダーとしてリストされていることを確認します。
以上です; Python が Power BI に統合されています。次に、それを使用する方法を検討します。
Power BI で Python を使用する方法
データをインポートするには
データをインポートするには、まずリボンから [データの取得] オプションを選択します。
表示されるポップアップ メニューで、「Python」を検索し、「Python スクリプト」オプションを選択します。
表示されるスクリプト入力に、小さなデータセットを作成する次の Python コードを入力します。
import pandas as pd
sales = pd.DataFrame({
'month': ['January', 'February', 'March'],
'value': [124000, 240000, 180000]
})
次に、Power BI で Python を使用してビジュアライゼーションを作成します。
ビジュアライゼーションを作成するには
作成したばかりのデータセットで表される 3 か月間の売上を示す単純な折れ線プロットを作成します。
ビジュアライゼーションを作成するには、まず、Power BI の右側にある [ビジュアライゼーション] パネルから [Python] オプションを選択します。 Python オプションには単に Py というラベルが付いています。すぐに表示されない場合は、3 つの点をクリックしてそこに表示されます。
これをクリックすると、スクリプトの視覚化を有効にするかどうかを尋ねるプロンプトが表示されます。これを受け入れると、Python ビジュアライゼーションを作成できるようになります。
その後、月フィールドと値フィールドを右端のデータ パネルから視覚化パネル、つまりデータ パネルのすぐ左にドラッグします。これにより、ビジュアライゼーションの作成時に使用するデータにアクセスできるようになります。
次に、下部に次のようなスクリプト エディター セクションが表示されます。
このスクリプトでは、データセット オブジェクト (月と値の列を含むパンダ データフレーム) にアクセスできます。また、スクリプトは重複した値を自動的に削除します。コメントされたコードはコメントされていても常に実行されるため、何もする必要はありません。
matplotlib を使用してビジュアライゼーションを作成するには、次のコードを作成します。
import matplotlib.pyplot as plt
dataset.plot(kind='line', x='month', y='value', color='blue')
plt.show()
これにより、データセットから折れ線プロットが作成されます。 X 軸には月が含まれ、Y 軸には値が含まれます。ラインの色は青になります。
次に、スクリプト エディターの右上にある実行ボタンをクリックすると、画面に視覚エフェクトが表示されるのがわかります。
それでおしまい! Python を使用して Power BI でビジュアライゼーションを作成することができました。この例は、 Matplotlib ドキュメント を使用してさまざまな視覚エフェクトに拡張できます。
コードの共有と再利用
Python を使用してビジュアライゼーションを作成する利点の 1 つは、ビジュアライゼーションの作成またはデータのインポートに使用されるコードをプロジェクト間で共有できることです。これにより、以前のレポートのコードを再利用して、新しいレポートを迅速に生成できます。
私の知る限り、Power BI にはデータを共有するための組み込みメカニズムはありませんが、ここでは古き良きコピー&ペーストが機能するはずです。少し面倒ですが、組み込みの視覚化ツールを使用して最初から視覚化を作成するよりも優れています。
Power BI での Python 統合の制限
Power BI を Python と統合するといくつかの利点がありますが、注意すべき制限もいくつかあります。これらには次のものが含まれます。
- Python の統合には、Python、pandas、および matplotlib の特定のバージョンが必要です。異なるバージョンを使用すると、エラーが発生する可能性があります。したがって、エラーを防ぐために依存関係を適切に管理することが重要です。
- すべての Python ライブラリがサポートされているわけではありません。つまり、Power BI でスクリプトを作成するときに使用できる Python ライブラリは限られています。
- 悪意のある者によるスクリプトが実行されるリスク。オンラインで入手してレポートで使用するスクリプトには注意する必要があります。これらは有害である可能性があります。
使用例
Python を使用した Power BI は、さまざまな作業を実行するのに役立ちます。これらには次のものが含まれます。
- 機械学習分析アプリケーションの作成
- ビジュアライゼーションとリアルタイム ダッシュボードの作成
- より複雑な方法でデータを変換する
最後の言葉
この記事では、人気のあるビジネス インテリジェンス ツールである Power BI の機能を、データ分析などに使用される人気のあるプログラミング言語である Python を使用して強化する方法を検討しました。この実装の利点と制限についても説明しました。この実装の一般的な使用例についても説明しました。
次に、Python の Matplotlib の概要を確認してください。