Data Forest の概要
    • PDF

    Data Forest の概要

    • PDF

    Article Summary

    最新のコンテンツが反映されていません。早急にアップデート内容をご提供できるよう努めております。最新のコンテンツ内容は韓国語ページをご参照ください。

    VPC環境で利用できます。

    Data Forestは、Apache Hadoopベースの大容量マルチテナントビッグデータ処理クラスタです。Data Forestは、様々なビッグデータフレームワークをサポートし、データ保存、データ処理、ディープラーニング分析、サービングを簡単で手軽に行うことができます。セキュリティ技術が適用され、大容量データが分散ストレージに保存されるため、安全に使用できます。

    df-overview_storage_vpc_ko

    Data Forestが提供する様々な機能

    • 統合分析環境
      Data Forestは、データ収集と処理、ディープラーニング分析、サービングまですべて可能な Apache Hadoopベースの統合分析プラットフォームです。YARNアプリケーション形態でサービスを実行し、ユーザーがアプリケーションを組み合わせてビッグデータエコシステムを作成できる環境を提供します。また、ユーザー別に GPUリソースの割り当てを動的に受け、Tensorflow、Pytorchなどのディープラーニング学習を行うことができます。

    • 簡単かつ迅速な分析環境の構成
      コンテナベースのサーバレス環境で簡単かつ迅速にアプリを立ち上げることができ、必要な Hadoopエコシステムをアプリベースで作成して分析環境を構成できます。大規模データと多くのユーザーを処理できるように設計されたマルチテナントベースの統合プラットフォームを提供します。分析目的に応じてバッチ分析ジョブができ、マルチテナント環境で Long-Live分析作業を行うことができます。

    • 柔軟な拡張性
      アプリの作成後も、使用量に応じて必要なだけコンテナを拡張または縮小することでトラフィックに柔軟に対応できます。コンテナベースであるため、オンライン状態で動的に拡張でき、必要に応じて迅速に変更できます。

    • 強化されたセキュリティ
      Data Forestは、セキュリティが強化された Secure Hadoop Clusterで、Kerberos/LDAP認証をサポートします。ネットワークを介して他の認証情報が転送されないように、秘密キー暗号化を使用して強力なセキュリティ環境を提供します。また、アプリケーションの権限管理において Apache Ranger認証によるセキュリティ機能を提供します。

    • 高水準のネットワークおよびディスクパフォーマンスを保証
      Data Forestは、アプリケーションベースのコンピューティングノードと物理サーバのローカルディスクベースに HDFS(Hadoop Distribute File System)保存場所を使用し、ネットワークパフォーマンスとディスクパフォーマンスを保証します。

    • 様々なコンポーネント
      Data Forestは、データ保存、分析、可視化できるコンポーネントで構成されています。ユーザーは、用途に合ったコンポーネントを作成して使用できます。データ保存には HDFS、HBase、Kafka、OpenTSDBを提供し、データ分析および処理には Spark、Hive、Hive LLAP、Elasticsearch、Grafana、Hue、Trino、Phoenixを提供し、データの可視化には Kibana、Zeppelinを提供します。

    • コンポーネントのアクセシビリティの強化およびウェブベースの開発環境を提供
      VPC環境でより簡単にコンポーネントにアクセスするためにプロキシ機能とウェブベースの開発環境である Jupyter Notebookを提供します。作成したノートブックノードの JupyterLabウェブページにアクセスし、ビックデータ分析と機械学習に必要なクエリとコードを実行できます。Object Storageの連携を通じてデータを柔軟に再利用できます。

    Data Forestご利用ガイドのご案内

    Data Forestは、韓国リージョンでサービスを提供しています。Data Forestを円滑に利用するために、以下の目次と目次別内容をご確認ください。

    Data Forest関連リソース

    NAVERクラウドプラットフォームでは、Data Forestについて顧客の理解に役立つよう、ガイドの他にも様々な関連リソースを提供しています。Data Forestを会社に導入しようと検討中の方や、データ関連ポリシーを策定する上で詳細情報を必要とする開発者、マーケターなどの方は以下のリソースを積極的に活用することをお勧めします。

    よくある質問を先にご確認ください。

    ガイドを読む前に、よくある質問への回答をチェックすると不明な点をスピーディーに解消できます。以下のよくある質問から答えが得られなかった場合、ご利用ガイドで必要な内容をご確認ください。

    Q. Cloud Hadoopと Data Forestは類似する性質のサービスに見えますが、どのような違いがありますか?
    A. 2つのサービスは、サーバ/サーバレスに基づくという違いがあります。

    • Cloud Hadoopは顧客専用リソースを基に ハドゥープクラスタを構築して提供します。
      • 顧客がハドゥープを直接管理する self-managed型のサービスです。
      • 直接管理できるオープンソースベースのウェブ管理ツール(Apache Ambari)を提供しています。
    • Data Forestはサーバレス型のサービスであり、分析に必要な Job(DL Job)を提出して使用します。long-livedな作業が必要な Hadoop Ecosystemは Appを作成して簡単に分析することができます。
      • 顧客が直接ハドゥープを管理するのではなく、サービスレベルで高可用性を保証する managed型のサービスです。
      • Cloud Hadoopよりも多くの Appを提供しており、GPUベースの Deep Learning Jobも提出できます。

    比較

    FeatureCloud HadoopData Forest
    拡張性ユーザーが Hadoopクラスタのサイズを直接決定
    コストHadoopクラスタの維持料金発生ユーザーが実行中のタスク、ストレージに対する料金発生
    メンテナンスユーザーが直接管理、ユーザー管理ツール(Apache Ambari)をサポートサービスで管理
    特徴ユーザーが自由に環境を構成可能様々な Appを提供。GPUベースの Deep Learningタスクを提出可能

    Q. リアルタイムデータを収集・処理したり、ETL環境を構成するための機能はどのように提供されますか?
    A. Data Forestで直接リアルタイムデータの収集・処理を提供したりはしませんが、NAVER Cloud Platformの様々なサービスと Data Forestで提供する Appで構成された Hadoop Ecosystemを利用して環境を構成できます。専門的な ETL構成のためのサービスは、今後別途のサービスにてリリースする予定です。

    Q. Data Forestで提供する Quick linksにアクセスしたいです。どうやってアクセスしますか?
    A. Quick linksにアクセスするためには Data Forestノートブックサーバが必要です。 Data Forest > Notebooks で作成できます。
    詳細は、Quick linksにアクセスをご参照ください。

    Q. ユーザー PCとノートブックの間に SSHトンネルを作成するために、ユーザー PCのターミナルで作成コマンドを入力すると、引き続きパスワードを入力するように求められます。
    A. 認証キーで認証に失敗した場合、引き続きパスワードをリクエストします。SSHコマンド実行時に使用したキーがノートブック作成時に設定したログインキーと異なる場合に発生する可能性があります。もし認証キーを紛失した場合は、認証キー変更を行ってください。


    この記事は役に立ちましたか?

    Changing your password will log you out immediately. Use the new password to log back in.
    First name must have atleast 2 characters. Numbers and special characters are not allowed.
    Last name must have atleast 1 characters. Numbers and special characters are not allowed.
    Enter a valid email
    Enter a valid password
    Your profile has been successfully updated.