AWS資格一問一答

Q7

あなたの会社は、複数のデータソースから大量のデータを取り込み、そのデータをクレンジング、変換、および結合して、結果をAmazon RedshiftにロードするETLパイプラインを構築することを計画しています。どのAWSサービスが、このシナリオに最適なETLツールとなりますか？

A. AWS Glue

B. Amazon EMR

C. AWS Lambda

D. AWS Data Pipeline

ワンポイントアドバイス✌️

大量のデータを取り込み、クレンジング、変換、結合し、Amazon Redshiftにロードするのに適したETLツールを選んでください。

正解は「A」、AWS Glueです！

解説:

このシナリオでは、複数のデータソースから大量のデータを取り込み、クレンジング、変換、結合し、最終的にAmazon RedshiftにロードするETLパイプラインを構築する必要があります。

選択肢AのAWS Glueは、完全にマネージドされたサーバーレスETLサービスで、このシナリオに最適です。AWS Glueは、データのクレンジング、変換、結合などのETLタスクを自動化し、Amazon Redshiftなどのデータストアにデータを簡単にロードできます。

選択肢BのAmazon EMRは、Hadoopエコシステムを利用したビッグデータ処理に適していますが、ETLタスクの自動化には最適ではありません。選択肢CのAWS Lambdaは、サーバーレスのイベント駆動アーキテクチャを実現するためのサービスですが、大量のデータを処理するETLワークロードには適していません。選択肢DのAWS Data Pipelineは、データの移動と変換を自動化するためのサービスですが、クレンジングや結合といったETLタスクの自動化には最適ではありません。

正解は「A」のAWS Glueで、このシナリオに最適なETLツールです。

前の問題へ

次の問題へ