Hiroki Naganuma

AI Design に関する技術面接準備

想定される質問(ハイレベル)

実践的な問題へのアプローチ方法、トレードオフの特定、ソリューション設計、および潜在的な問題の予測についての洞察を示すことが重要。

期待されるスキル

準備1

Benckmarking の研究

e.g.

  1. Optimizer Selection for OOD Generalization
  2. Pre-trained Models for Calibration (12000 GPU Hours)
RTX8000 x 4 x [Num Run] x12H
Num Run = Models x Datasets x Seeds x Hyperparameters

100 model x 5 dataset x 3 seeds = 1500
1500 x 12H = 18000H

120,000/18,000 = 6.67
6.67 Hyperparameters per experiment

1500x6.67 = 10000 experiments

課題

  1. モデルの学習に時間がかかりすぎる
  2. 膨大な数の実験数をうまく管理する (10000 experiments)

解決策

  1. Pre-Trained Model を公開されているものからうまくサブセットを抽出する(比較可能な対象群を特定する)、グラントに応募する。
  2. 複数の計算機での実験結果を統一的に管理し、落ちた job などを特定、Rerun を自動でできるように実験管理を自動化。shell の自動生成。

教訓

  1. スコープを絞り、コミュニティの知を活用することで、解を導きたい問いに集中できる。
  2. 実験管理の自動化は、研究の効率を向上させる(マニュアルの管理には限界がある)、ほとんど wandb のような API のおかげ。

Pre-Training の効率化の研究

課題

  1. 研究リソースがない
  2. 数値実験における不安定さ

解決策

  1. 分散の研究であったが、1GPU で動作可能なシミュレーション環境を作成し、我々の手法の有効性を示すことで、研究リソースを得る交渉をする。
  2. アルゴリズム的不安定性を、実験的に原因を特定し、その原因を解決する。

Task Arithmetic の研究

課題

  1. Task Arithmetic がそもそもうまくいかない、その原因を特定する必要がある

解決策

  1. Task Arithmetic の定式化を行い、干渉を明示的に防ぐ方法を提案する。

準備2

推奨されるリソースと方法

練習問題の例

Reference