top of page
積み上がった本

AWS資格一問一答

Q7

あなたの会社は、複数のデータソースから大量のデータを取り込み、そのデータをクレンジング、変換、および結合して、結果をAmazon RedshiftにロードするETLパイプラインを構築することを計画しています。どのAWSサービスが、このシナリオに最適なETLツールとなりますか?


A. AWS Glue

B. Amazon EMR

C. AWS Lambda

D. AWS Data Pipeline

ワンポイントアドバイス✌️

大量のデータを取り込み、クレンジング、変換、結合し、Amazon Redshiftにロードするのに適したETLツールを選んでください。

正解は「A」、AWS Glueです!


解説: 

このシナリオでは、複数のデータソースから大量のデータを取り込み、クレンジング、変換、結合し、最終的にAmazon RedshiftにロードするETLパイプラインを構築する必要があります。


選択肢AのAWS Glueは、完全にマネージドされたサーバーレスETLサービスで、このシナリオに最適です。AWS Glueは、データのクレンジング、変換、結合などのETLタスクを自動化し、Amazon Redshiftなどのデータストアにデータを簡単にロードできます。


選択肢BのAmazon EMRは、Hadoopエコシステムを利用したビッグデータ処理に適していますが、ETLタスクの自動化には最適ではありません。選択肢CのAWS Lambdaは、サーバーレスのイベント駆動アーキテクチャを実現するためのサービスですが、大量のデータを処理するETLワークロードには適していません。選択肢DのAWS Data Pipelineは、データの移動と変換を自動化するためのサービスですが、クレンジングや結合といったETLタスクの自動化には最適ではありません。


正解は「A」のAWS Glueで、このシナリオに最適なETLツールです。

※ 本ページの内容はβ版です。
​※ 記載の内容に誤りがあった場合、問い合わせフォームよりご連絡下さい。
​※ 本ページの内容で生じた損害について、責任は追いません。損害が発生しうる作業に用いる場合、本ページの利用を禁止します。

© 2023 Kamogawa Technology development LLC. All Rights Reserved.

bottom of page