銀河鉄道

【パワークエリ】ベストプラクティス

サムネイル
パワークエリベストプラクティス

パワークエリの最善の方法をマスターしたい

公式で確認

ベストプラクティス

  1. 適切なコネクタを選択する
  2. フィルター処理を早期に行う
    • 【最初にフィルター】
  3. 負荷が大きい操作を最後に行う
    • 【最後に並べ替え】
  4. データのサブセットを一時的に処理する
    • 【行を一時的に削除→あとで元に戻す】
  5. 正しいデータ型を使用する
  6. データを調査する
  7. 作業を文書化する
    • 【わかりやすい名前をつける】
  8. モジュール方式のアプローチを採用する
    • 【長いステップは分割】
  9. グループを作成する
  10. 長く使用できるクエリ
  11. パラメーターを使用する
  12. 再利用可能な関数を作成する

1. 適切なコネクタを選択する

たとえば、SQL Server データベースに接続するときに ODBC コネクタの代わりに SQL Server コネクタを使用すると、 [データの取得] のエクスペリエンスが大幅に向上する

2.フィルター処理を早期に行う

最初にフィルター

とにかくフィルターが先

クエリの初期のステージまたは可能な限り早い段階でデータをフィルター処理することが、常に推奨されます。

不要な値は、最初にフィルターで除外

関連のあるデータのみを表示することで、目の前のタスクに集中できます。

まずは捨てる

3. 負荷が大きい操作を最後に行う

並べ替えは、最後

並べ替えは、負荷が大きい

(並べ替え操作は)すべての 行を読み取る必要があります。

すべての行を読むから、プレビューに時間かかる

4. データのサブセットを一時的に処理する

最初は行数を少なくする→最後に元に戻す

遅いと感じたら、一時的に行を削除しておく

ステップを追加する処理が遅い場合は、最初に “最初の行を保持する” 操作を実行し、処理する行の数を制限します。 その後、必要なすべてのステップを追加したら、”最初の行を保持する” ステップを削除します。

5. 正しいデータ型を使用する

列の正しいデータ型を常に使用することが重要です。

6. データを調査する

データ プロファイル ツールを有効にして、データに関する情報を簡単に検出することをお勧めします。

7. 作業を文書化する

わかりやすい名前をつけたり、説明を追加したり

ステップ、クエリ、グループの名前を変更するか、説明を追加して、クエリを文書化することをお勧めします。

8. モジュール方式のアプローチを採用する

モジュール方式とは、「部品化」すること

より小さな部分に単純化して切り離し、理解しやすくする

長いステップは分割

「前のステップの抽出」でステップを分割できる

ステップを右クリック→「前のステップの抽出」で、分割

ステップが多いために一見して困難と感じるようなことがないレベルに、クエリを維持することをお勧めします

9. グループを作成する

各クエリをグループ分けする

意味のあるわかりやすい名前をグループに付けてみてください。

10. 長く使用できるクエリ

将来更新されても問題が発生しないクエリを作成することが最優先事項です。

例)抽出したい行数が決まっているとき

「行の保持」をすれば、不要な行があっても大丈夫

例)抽出したい列が決まっているとき

「列の選択」をすれば、予想してなかった列があっても大丈夫

例)一部の値のデータ型が異なるエラー

  • エラー値を生成した行を削除

11. パラメーターを使用する

パラメーターは、さまざまな方法で再利用できる値を簡単に格納および管理する手段として機能します。

ステップ引数

複数の変換の引数としてパラメーターを使用できる

カスタム関数引数

クエリから新しい関数を作成し、カスタム関数の引数としてパラメーターを参照できる

12. 再利用可能な関数を作成する

何回でも再利用できる Power Query のカスタム関数を作成すると便利です。

関連記事

著者

author
月うさぎ

編集後記:
この記事の内容がベストではないかもしれません。