KAMOTECH

AWS資格一問一答
Q7
あなたの会社は、複数のデータソースから大量のデータを取り込み、そのデータをクレンジング、変換、および結合して、結果をAmazon RedshiftにロードするETLパイプラインを構築することを計画しています。どのAWSサービスが、このシナリオに最適なETLツールとなりますか?
A. AWS Glue
B. Amazon EMR
C. AWS Lambda
D. AWS Data Pipeline
ワンポイントアドバイス✌️
大量のデータを取り込み、クレンジング、変換、結合し、Amazon Redshiftにロードするのに適したETLツールを選んでください。
正解は「A」、AWS Glueです!
解説:
このシナリオでは、複数のデータソースから大量のデータを取り込み、クレンジング、変換、結合し、最終的にAmazon RedshiftにロードするETLパイプラインを構築する必要があります。
選択肢AのAWS Glueは、完全にマネージドされたサーバーレスETLサービスで、このシナリオに最適です。AWS Glueは、データのクレンジング、変換、結合などのETLタスクを自動化し、Amazon Redshiftなどのデータストアにデータを簡単にロードできます。
選択肢BのAmazon EMRは、Hadoopエコシステムを利用したビッグデータ処理に適していますが、ETLタスクの自動化には最適ではありません。選択肢CのAWS Lambdaは、サーバーレスのイベント駆動アーキテクチャを実現するためのサービスですが、大量のデータを処理するETLワークロードには適していません。選択肢DのAWS Data Pipelineは、データの移動と変換を自動化するためのサービスですが、クレンジングや結合といったETLタスクの自動化には最適ではありません。
正解は「A」のAWS Glueで、このシナリオに最適なETLツールです。