ホーム > Cloudera データアナリスト向けトレーニング

Cloudera データアナリスト向けトレーニング

コース基本情報

コースタイトル Cloudera データアナリスト向けトレーニング
コースコード NFC0181R  
コース種別 集合研修 形式 講義+実機演習
期間 4日間 時間 9:30~17:30 価格(税抜) 328,000円(税抜)
主催 Cloudera株式会社
日程 会場 空席状況 実施状況 選択

2017年6月26日(月) ~ 2017年6月29日(木)

Cloudera(新宿LC)

  お申し込み後確認

2017年8月21日(月) ~ 2017年8月24日(木)

Cloudera(新宿LC)

  お申し込み後確認

※「キャンセル待ち」でお申し込みの方には、別途メールにてご連絡いたします。
※「実施確定」表示のない日程は、お申し込み状況により開催中止になる場合がございます。
※ グローバルナレッジ主催コース以外の空席状況は、残席数に関わらず「お申し込み後確認」と表示されます。
※ グローバルナレッジ主催コース以外では、主催会社のお席を確保した後に受付確定となります。

詳しくはお問い合わせください。

ワンポイント

Cloudera社のシステム変更により、受講者様は受講前にあらかじめトレーニングアカウントをご自身で登録いただく手順に変更となりました。(2017/2/1以降に開催されるすべてのコースが対象となります)
お手数をおかけし恐縮ですが Cloudera社webページ:
トレーニングアカウントの作成手順 または こちらのPDF をご参照の上研修初日の前週木曜日までにトレーニングアカウントのご登録をお願いいたします。
(掲載日:2017/2/3)

対象者情報

対象者
・ Hadoop上でSQLや慣れ親しみのあるスクリプト言語を使用して、リアルタイムに大規模かつ複雑なデータを管理、操作、照会したい方
前提条件
□ 基本的なSQLを知っている
□ スクリプト言語(例: Perl, Python, Ruby)の知識があると望ましい
□ 基本的なUNIXまたはLinuxのコマンドについての経験がある
(Hadoopの事前知識は必要ありません)

学習内容の詳細

コース概要
この4日間のハンズオンコースでは、Hadoop上でSQLやスクリプト言語を使用して、大規模かつ複雑なデータを管理、操作、照会します。Apache Pig, Apache Hive, Cloudera Impalaにより、フィルタや結合、ユーザー定義関数により、大規模データの変換と分析を効率よく行います。
学習目標
● Apache HadoopおよびHadoopのツールを使用したデータのETL(抽出、変換、挿入)、取り込みと処理の基本を理解する
● Pigによる複数データセットの結合と異質なデータの解析方法を理解し、使用する
● Hiveによるテーブルへのデータ編成、変換処理、複雑なクエリの単純化を理解し、使用する
● ImpalaのSQLを使用して、HDFSやHBase上に格納された膨大なデータに対してリアルタイムに分析を実行する方法を理解し、使用する
学習内容
1. はじめに

2. Hadoopの基本

3. Pig入門

4. Pigによる基本的なデータ解析

5. Pigで複雑なデータを処理する

6. Pigによる複数データセットの操作

7. Pigのトラブルシューティグと最適化

8. HiveとImpala入門

9. HiveとImpalaによるクエリ

10. データ管理

11. データストレージとパフォーマンス

12. HiveとImpalaでリレーショナルデータの分析

13. Impalaで作業を行う

14. Hiveでテキストと複雑なデータを分析する

15. Hiveの最適化

16. Hiveを拡張する

17. ジョブに最適なツールを選択する

18. まとめ

ご注意・ご連絡事項

・ 本コースはCloudera株式会社が開催いたします。
・ Cloudera株式会社開催コースの受講お申し込みは2営業日前まで、日程変更は7営業日前まで、キャンセルは11営業日前までとさせて頂きます。
なお、キャンセル料の扱いは以下のとおりです。
・コース開始日の10営業日~5営業日前のキャンセル:受講料の50%を請求
・コース開始日の4営業日前~当日のキャンセル:受講料の全額を請求
・日程変更後のキャンセル:お申し出日に関わらず受講料の全額を請求