hivefans
1/14/2016 - 2:13 PM

Embulk how to

Embulk how to

移動しました

Embulk

Embulkってなに?ということから、Embulkのプラグインを開発するところまでをまとめたページです。

Embulkとは

古橋さんブログから EmbulkはFluentdのバッチ処理版のようなツールで、CSVデータやアクセスログなどの構造化データを高い信頼性で転送することができるコンパクトなツールです。

並列データ転送ツール『Embulk』リリース!(古橋さんブログ2)

トレジャーデータブログもあわせて読みましょう。

Embulkを使ってみる

Treasure Dataの新データ転送ツールEmbulkを触ってみたが詳しいです。

様々なプラグイン

既に色々なプラグインが開発されています。

Embulk 0.4.0リリースで、プラグイン構造が代わり新しいgemは、Embulk-{Input|Output|Filter}-XXXという名前で作成するようになりました。ここに記載しているGemは0.3.2以前に作られたものです。ご注意ください。

最新のパッケージはこちらを参照してください。 Search embulk packages in Rubygems

Input プラグイン

Output プラグイン

Filter プラグイン

プラグインの開発

自分でプラグインを書こうと思っているひとはこのあたりを参考にしましょう。なおEmbulk 0.4から、プラグインジェネレータが利用できるようになるようです。

内部構成