AWS

AWS認定ビッグデータスペシャリティサンプル試験問題3

AWSAWS認定ビッグデータスペシャリティAWS認定資格

質問

原文

3) A customer needs to load a 550-GB data file into an Amazon Redshift cluster from Amazon S3, using the COPY command. The input file has both known and unknown issues that will probably cause the load process to fail. The customer needs the most efficient way to detect load errors without performing any cleanup if the load process fails.

Which technique should the customer use?

    A) Split the input file into 50-GB blocks and load them separately.
    B) Use COPY with NOLOAD parameter.
    C) Write a script to delete the data from the tables in case of errors.
    D) Compress the input file before running COPY.

googleで日本語翻訳

3)COPYコマンドを使用してAmazon S3のAmazon Redshiftクラスタに550 GBのデータファイルをロードする必要があります。 入力ファイルには、既知の問題と未知の問題があり、おそらくロードプロセスが失敗する可能性があります。 ロード・プロセスが失敗した場合にクリーンアップを実行せずに、ロード・エラーを検出する最も効率的な方法が必要です。

顧客はどの技術を使用すべきですか?

     A)入力ファイルを50 GBブロックに分割し、別々にロードします。
     B)NOLOADパラメーターでCOPYを使用します。
     C)エラーが発生した場合、テーブルからデータを削除するスクリプトを作成します。
     D)COPYを実行する前に入力ファイルを圧縮します。

bingで日本語翻訳

3) お客様は、copy コマンドを使用して、amazon の s3 から amazon redshift クラスタに 550 gb のデータファイルをロードする必要があります。入力ファイルには既知の問題と不明なエラーの両方があり、おそらくロードプロセスが失敗する原因となります。お客様は、ロード・プロセスが失敗した場合にクリーンアップを実行せずに、ロード・エラーを検出する最も効率的な方法を必要とします。

お客様が使用するテクニック

a) 入力ファイルを 50 gb ブロックに分割し、別々にロードします。
b) noload パラメータでコピーを使用します。
c) エラーが発生した場合にテーブルからデータを削除するスクリプトを記述します。
d) コピーを実行する前に、入力ファイルを圧縮します。

解答

原文

3) B - From the AWS Documentation for NOLOAD: NOLOAD checks the integrity of all of the data without loading it into the database. The NOLOAD option displays any errors that would occur if you had attempted to load the data. All other options will require subsequent processing on the cluster which will consume resources.

googleで日本語翻訳

3)B - AWSのNOLOADドキュメント:NOLOADは、すべてのデータの整合性をデータベースにロードせずにチェックします。 NOLOADオプションは、データのロードを試みた場合に発生するエラーを表示します。 他のすべてのオプションは、リソースを消費するクラスタでの後続の処理を必要とします。

bingで日本語翻訳

3) b-noload の aws ドキュメントから: noload は、データベースに読み込まずにすべてのデータの整合性をチェックします。noload オプションは、データを読み込もうとした場合に発生するエラーを表示します。その他のオプションでは、リソースを消費するクラスタでの後続の処理が必要になります。