昨年12月に Dataform の Google Cloud 加入が発表 されて以来, 関心を持って調べています. Dataform は BigQuery などのデータウェアハウス上で SQL を中心としたデータ変換パイプラインを構築するための仕組みです. 先日は Dataform で Google Analytics 4 の BigQuery Export データ を変換するパイプラインを作ってみたりもしました
以前の記事 では Docker で RStudio Server を起動する方法について触れました。 このとき、ブラウザで RStudio Server に接続した際に自動的にプロジェクトが開くようにできるとさらに便利です。 これは公式に提供されている機能ではないのですが、隠しファイル /home/rstudio/.rstudio/projects_settings/switch-to-project にプロジェクトのパスが書き込
概要 R のプロジェクトで renv(パッケージ管理システム)と Docker を同時に使う利用法として3種類のパターンを取り上げます。 多くの分析プロジェクトでは renv パッケージキャッシュを外から Docker コンテナにマウントする “外付けパッケージキャッシュパタ
R プロジェクトテンプレート 前の記事 では Docker + RStudio Server プロジェクトの GitHub テンプレート terashim/rstudio-docker-project-template を紹介しました。 このテンプレートから派生して、Google API 系パッケージを使った R プロジェクトのテンプレートを作成しました: terashim/rstudio-docker-google-project-template API を使うには認可が必要になりますが、そ
概要 GitHub で Rプロジェクトを作成するためのテンプレートリポジトリを作成しました。 これには Docker Compose でローカル RStudio Server 環境を起動するための設定が含まれています。 このテンプレートリポジトリは https://github.com/terashim/rstudio-docker-project-template で公開されています。 以下ではこのテンプレートの構成について解説し、
nycflights13 とは、2013年のニューヨーク市発の航空便に関するデータセットを収めたRパッケージです。このデータの構造や出典、各列の意味に関してヘルプに記載された内容を和訳しておきます。。 パッケージの概要 ニューヨーク市 (EWR, JFK, LGA などの空港) を出発地とし、米
目的 GitHub上にRパッケージのソースリポジトリがあり、rocker/rstudio にこのRパッケージをインストールしたDockerイメージを作成する場面を考えます。このとき、ビルド中にGitHubと接続するため認証情報を使用する必要があ
2022/4/22 追記 その後、Cloud BuildとSecret Managerとの連携が簡単に設定できるようになっていました: Secret Manager のシークレットの使用 | Cloud Build のドキュメント | Google Cloud availableSecrets フィールドを使用すれば、Secret Manager シークレットの内容を環境変数に反映させる
Rパッケージは CRAN からインストールするのが普通ですが、 まだ CRAN に登録されていない開発版のRパッケージや、独自に開発したRパッケージを GitHub からインストールして使いたいこともあります。 この記事では Docker イメージ rocker/rstudio や rocker/tidyverse をベースに、GitHub上にあるRパッ
本記事ではDockerにおける秘密情報を (I) コンテナを起動する際に使用する秘密情報 と (II) イメージをビルドする際に必要となる秘密情報 に分類して考え、特に後者を安全に取り扱うための方法について整理します。 コンテナ起動時の秘密情報とイメージビルド時の