KAMOTECH

AWS資格一問一答
Q5
あなたの会社は、Kinesis Data Streamsを使用してリアルタイムのストリーミングデータを処理しています。データはAmazon S3に保存され、後で分析のために使用されます。ただし、データの品質が悪く、不完全なデータがストリームに含まれることがあります。これに対処するために、リアルタイムでデータのクレンジングと検証を実行するための最適な方法は何ですか?
A. Kinesis Data Analyticsを使用して、SQLクエリを実行してデータをクレンジングし、検証します。
B. Kinesis Data Firehoseを使用して、データをクレンジングし、検証した後にAmazon S3に保存します。
C. AWS Lambda関数を使用して、Kinesis Data Streamsからデータを読み取り、クレンジングおよび検証を実行し、結果をAmazon S3に保存します。
D. Amazon EMRを使用して、Kinesis Data Streamsからデータを読み取り、クレンジングおよび検証を実行し、結果をAmazon S3に保存します。
ワンポイントアドバイス✌️
正解は「A」、Kinesis Data Analyticsです!
解説:
このシナリオでは、リアルタイムでデータのクレンジングと検証を実行するための最適な方法を求めています。Kinesis Data Streamsを使用してリアルタイムのストリーミングデータを処理しているため、リアルタイム分析が可能で、Kinesis Data Streamsと連携できる適切なサービスを選ぶ必要があります。
選択肢AのKinesis Data Analyticsは、Kinesis Data Streams上のリアルタイムデータに対してSQLクエリを実行できるサービスで、データのクレンジングと検証に適しています。
選択肢BのKinesis Data Firehoseは、リアルタイムストリーミングデータを収集して、Amazon S3などのデータストアに保存するサービスですが、データのクレンジングと検証は行いません。選択肢CのAWS Lambda関数は、イベント駆動のコード実行環境を提供しますが、リアルタイムでデータのクレンジングと検証には最適ではありません。選択肢DのAmazon EMRは、ビッグデータを処理するためのクラスター管理サービスで、リアルタイムでデータのクレンジングと検証には適していません。
正解は「A」のKinesis Data Analyticsで、リアルタイムでデータのクレンジングと検証が可能で、Kinesis Data Streamsと連携できる適切なサービスです。