Microsoft Data Engineering on Microsoft Azure (DP-203日本語版) - DP-203日本語 Exam Practice Test
Azure Synapse Analytics アカウントと Microsoft Purview アカウントを含む Azure サブスクリプションがあります。
専用 SQL プールへのデータ インジェスト用に、Pipeline1 という名前のパイプラインを作成します。
Pipeline1 から Microsoft Purview へのデータ系統を生成する必要があります。
どの 2 つのアクティビティがデータ リネージを生成しますか? それぞれの正解は完全なソリューションを示します。
注意: 正しい選択ごとに 1 ポイントが付与されます。
専用 SQL プールへのデータ インジェスト用に、Pipeline1 という名前のパイプラインを作成します。
Pipeline1 から Microsoft Purview へのデータ系統を生成する必要があります。
どの 2 つのアクティビティがデータ リネージを生成しますか? それぞれの正解は完全なソリューションを示します。
注意: 正しい選択ごとに 1 ポイントが付与されます。
Correct Answer: A,C
CSVファイルからデータを取り込み、指定されたタイプのデータに列をキャストし、AzureSynapseAnalytics専用のSQLプールのテーブルにデータを挿入するAzureDataFactoryデータフローを作成しています。CSVファイルには、username、comment、dateという名前の列が含まれています。
データフローには、すでに次のものが含まれています。
*ソース変換
*適切なタイプのデータを設定するための派生列変換
*データをプールに配置するためのシンク変換
データフローが次の要件を満たしていることを確認する必要があります。
*すべての有効な行を宛先テーブルに書き込む必要があります。
*コメント列の切り捨てエラーは事前に回避する必要があります。
*挿入時に切り捨てエラーが発生するコメント値を含む行は、BLOBストレージ内のファイルに書き込む必要があります。
実行する必要がある2つのアクションはどれですか?それぞれの正解は、解決策の一部を示しています。注:正しい選択はそれぞれ1ポイントの価値があります
データフローには、すでに次のものが含まれています。
*ソース変換
*適切なタイプのデータを設定するための派生列変換
*データをプールに配置するためのシンク変換
データフローが次の要件を満たしていることを確認する必要があります。
*すべての有効な行を宛先テーブルに書き込む必要があります。
*コメント列の切り捨てエラーは事前に回避する必要があります。
*挿入時に切り捨てエラーが発生するコメント値を含む行は、BLOBストレージ内のファイルに書き込む必要があります。
実行する必要がある2つのアクションはどれですか?それぞれの正解は、解決策の一部を示しています。注:正しい選択はそれぞれ1ポイントの価値があります
Correct Answer: B,C
注: この質問は、同じシナリオを提示する一連の質問の一部です。シリーズの各質問には、記載された目標を達成する可能性のある独自のソリューションが含まれています。一部の質問セットには複数の正解がある場合もあれば、正解がない場合もあります。
このセクションの質問に答えた後は、その質問に戻ることはできません。その結果、これらの質問はレビュー画面に表示されません。
あなたは、Twitter データを分析する Azure Stream Analytics ソリューションを設計しています。
10 秒ごとにツイートをカウントする必要があります。ソリューションでは、各ツイートが 1 回だけカウントされるようにする必要があります。
解決策: 5 秒のホップ サイズと 10 秒のウィンドウ サイズを使用するホッピング ウィンドウを使用します。
これは目標を達成していますか?
このセクションの質問に答えた後は、その質問に戻ることはできません。その結果、これらの質問はレビュー画面に表示されません。
あなたは、Twitter データを分析する Azure Stream Analytics ソリューションを設計しています。
10 秒ごとにツイートをカウントする必要があります。ソリューションでは、各ツイートが 1 回だけカウントされるようにする必要があります。
解決策: 5 秒のホップ サイズと 10 秒のウィンドウ サイズを使用するホッピング ウィンドウを使用します。
これは目標を達成していますか?
Correct Answer: A
Explanation: Only visible for ExamsLabs members. You can sign-up / login (it's free).
Azure Data Lake Storage Gen2 コンテナーがあります。
データはコンテナーに取り込まれ、データ統合アプリケーションによって変換されます。その後、データは変更されません。ユーザーはコンテナー内のファイルを読み取ることができますが、ファイルを変更することはできません。
次の要件を満たすデータ アーカイブ ソリューションを設計する必要があります。
新しいデータは頻繁にアクセスされ、できるだけ早く利用できるようにする必要があります。
5 年以上前のデータにアクセスする頻度は低くなりますが、要求されたときに 1 秒以内に利用できるようにする必要があります。
7 年以上前のデータにはアクセスしません。 7 年後、データは可能な限り低いコストで永続化する必要があります。
必要な可用性を維持しながら、コストを最小限に抑える必要があります。
データをどのように管理する必要がありますか?答えるには、答えで適切なオプションを選択します。
注: 正しい選択ごとに 1 ポイントの価値があります。

データはコンテナーに取り込まれ、データ統合アプリケーションによって変換されます。その後、データは変更されません。ユーザーはコンテナー内のファイルを読み取ることができますが、ファイルを変更することはできません。
次の要件を満たすデータ アーカイブ ソリューションを設計する必要があります。
新しいデータは頻繁にアクセスされ、できるだけ早く利用できるようにする必要があります。
5 年以上前のデータにアクセスする頻度は低くなりますが、要求されたときに 1 秒以内に利用できるようにする必要があります。
7 年以上前のデータにはアクセスしません。 7 年後、データは可能な限り低いコストで永続化する必要があります。
必要な可用性を維持しながら、コストを最小限に抑える必要があります。
データをどのように管理する必要がありますか?答えるには、答えで適切なオプションを選択します。
注: 正しい選択ごとに 1 ポイントの価値があります。

Correct Answer:

Explanation:

Box 1: Move to cool storage
Box 2: Move to archive storage
Archive - Optimized for storing data that is rarely accessed and stored for at least 180 days with flexible latency requirements, on the order of hours.
The following table shows a comparison of premium performance block blob storage, and the hot, cool, and archive access tiers.

Reference:
https://docs.microsoft.com/en-us/azure/storage/blobs/storage-blob-storage-tiers Explanation:
Box 1: Replicated
Replicated tables are ideal for small star-schema dimension tables, because the fact table is often distributed on a column that is not compatible with the connected dimension tables. If this case applies to your schema, consider changing small dimension tables currently implemented as round-robin to replicated.
Box 2: Replicated
Box 3: Replicated
Box 4: Hash-distributed
For Fact tables use hash-distribution with clustered columnstore index. Performance improves when two hash tables are joined on the same distribution column.
Reference:
https://azure.microsoft.com/en-us/updates/reduce-data-movement-and-make-your-queries-more-efficient-with- the-general-availability-of-replicated-tables/
https://azure.microsoft.com/en-us/blog/replicated-tables-now-generally-available-in-azure-sql-data-warehouse/
Azure Synapse Analytics 専用の SQL プールがあります。
プール内のデータが保管時に暗号化されていることを確認する必要があります。ソリューションでは、データをクエリするアプリケーションを変更する必要はありません。
あなたは何をするべきか?
プール内のデータが保管時に暗号化されていることを確認する必要があります。ソリューションでは、データをクエリするアプリケーションを変更する必要はありません。
あなたは何をするべきか?
Correct Answer: D
Explanation: Only visible for ExamsLabs members. You can sign-up / login (it's free).
Azure Synapse Analytics 専用の SQL プールにパーティション分割されたテーブルがあります。
パーティションの削除の利点を最大化するには、クエリを設計する必要があります。
Transact-SQL クエリには何を含める必要がありますか?
パーティションの削除の利点を最大化するには、クエリを設計する必要があります。
Transact-SQL クエリには何を含める必要がありますか?
Correct Answer: C
Azure Synapse Analytics 専用 SQL プール内のファクト テーブルのパーティション戦略を設計しています。テーブルには次の仕様があります。
* 20,000製品の販売データを含みます。
* ProduclID という名前の列でハッシュ分散を使用し、
* 2019 年と 2020 年の 24 億件のレコードが含まれています。
クラスター化列ストア インデックスの最適な圧縮とパフォーマンスを提供するパーティション範囲の数は?
* 20,000製品の販売データを含みます。
* ProduclID という名前の列でハッシュ分散を使用し、
* 2019 年と 2020 年の 24 億件のレコードが含まれています。
クラスター化列ストア インデックスの最適な圧縮とパフォーマンスを提供するパーティション範囲の数は?
Correct Answer: D
Explanation: Only visible for ExamsLabs members. You can sign-up / login (it's free).
Storage1とStorage2という名前の2つのAzureStorageアカウントがあります。各アカウントは1つのコンテナを保持し、階層名前空間が有効になっています。システムには、ApacheParquet形式で保存されたデータを含むファイルがあります。
Data Factoryのコピーアクティビティを使用して、フォルダとファイルをStorage1からStorage2にコピーする必要があります。ソリューションは、次の要件を満たす必要があります。
変換を実行する必要はありません。
元のフォルダ構造を保持する必要があります。
コピーアクティビティの実行に必要な時間を最小限に抑えます。
コピーアクティビティをどのように構成する必要がありますか?回答するには、回答領域で適切なオプションを選択します。
注:正しい選択はそれぞれ1ポイントの価値があります。

Data Factoryのコピーアクティビティを使用して、フォルダとファイルをStorage1からStorage2にコピーする必要があります。ソリューションは、次の要件を満たす必要があります。
変換を実行する必要はありません。
元のフォルダ構造を保持する必要があります。
コピーアクティビティの実行に必要な時間を最小限に抑えます。
コピーアクティビティをどのように構成する必要がありますか?回答するには、回答領域で適切なオプションを選択します。
注:正しい選択はそれぞれ1ポイントの価値があります。

Correct Answer:

Explanation:

Box 1: Parquet
For Parquet datasets, the type property of the copy activity source must be set to ParquetSource.
Box 2: PreserveHierarchy
PreserveHierarchy (default): Preserves the file hierarchy in the target folder. The relative path of the source file to the source folder is identical to the relative path of the target file to the target folder.
Reference:
https://docs.microsoft.com/en-us/azure/data-factory/format-parquet
https://docs.microsoft.com/en-us/azure/data-factory/connector-azure-data-lake-storage
ある会社は、侵入検知データを分析するために Apache Spark 分析を使用することを計画しています。
悪意のあるアクティビティやポリシー違反について、ネットワークとシステムのアクティビティ データを分析するためのソリューションを推奨する必要があります。ソリューションは、管理作業を最小限に抑える必要があります。
何をお勧めしますか?
悪意のあるアクティビティやポリシー違反について、ネットワークとシステムのアクティビティ データを分析するためのソリューションを推奨する必要があります。ソリューションは、管理作業を最小限に抑える必要があります。
何をお勧めしますか?
Correct Answer: B
Explanation: Only visible for ExamsLabs members. You can sign-up / login (it's free).
オンライン注文のレコードを含むデータセットのスタースキーマを設計しています。各レコードには、注文日、注文期日、および注文出荷日が含まれます。
任意の日付範囲を照会し、会計カレンダー属性で集計する場合、設計がレコードの最速の照会時間を提供することを確認する必要があります。
どの2つのアクションを実行する必要がありますか?それぞれの正解は、解決策の一部を示しています。
注:正しい選択はそれぞれ1ポイントの価値があります。
任意の日付範囲を照会し、会計カレンダー属性で集計する場合、設計がレコードの最速の照会時間を提供することを確認する必要があります。
どの2つのアクションを実行する必要がありますか?それぞれの正解は、解決策の一部を示しています。
注:正しい選択はそれぞれ1ポイントの価値があります。
Correct Answer: A,D