実験ログ
ベースの lab 実行日は 2026-03-23、端末仕様と throughput 参照値の追跡確認日は 2026-03-25 です。
要約
adb forward+ SSH による Termux 接続は動作しました。- 当時の Android release asset は、この lab ではそのまま使える Termux CLI bundle には見えませんでした。
- patched local source build により、Termux 上で
llama-cliとllama-finetune-loraが動作しました。 - TQ1 と公開 biomedical adapter の推論が成功しました。
- TQ2 tiny training は checkpoint まで進行しました。
- TQ2 fast checkpoint inference では、短い completion を返しました。
Evidence 参照
- Evidence manifest
- Training snippet
- Fast checkpoint inference snippet
- TQ1 throughput rerun snippet
- TQ2 throughput rerun snippet
実行時スナップショット
- market name:
Redmi 14C - device codename:
pond - Android:
15 - SoC: Mediatek
MT6769/ boardmt6768 - CPU ABI:
arm64-v8a - CPU cluster:
1.70 GHzまでの 6 core と2.00 GHzまでの 2 core - ARM part ID からの推定 core type:
6x Cortex-A55+2x Cortex-A75 - Vulkan 上で見えた GPU:
Mali-G52 MC2 /proc/meminfoの RAM:7849100 kB- 確認時点の
/data:223G total / 74G used / 149G avail
単発 Throughput 参照
prompt 処理、generation、end-to-end を分けて記録しています。
| Run | Prompt tokens | Prompt tok/s | Generation tokens | Generation tok/s | End-to-end tok/s | 補足 |
|---|---|---|---|---|---|---|
TQ1 base + 公開 biomedical adapter rerun (2026-03-25) | 18 | 0.17 | 63 | 0.63 | 0.39 | 公開 adapter 経路の単発 rerun |
TQ2 fast checkpoint rerun (2026-03-25) | 18 | 0.21 | 7 | 0.13 | 0.18 | checkpoint_step_00000006/model.gguf を使った短縮設定 |
計算メモ
- TQ1 end-to-end throughput:
81 total tokens / 207.29636 s = 0.3907 tok/s - TQ2 end-to-end throughput:
25 total tokens / 138.11535 s = 0.1810 tok/s - prompt と generation の速度は rerun snippet の
common_perf_print行に対応します。 - end-to-end 値には model load、prompt eval、generation がすべて含まれます。
未解決事項
- 最終
--output-adapter生成自体は公開成功点としては未検証です。 - 終了時には
FORTIFY: pthread_mutex_lock called on a destroyed mutexが残っています。 - tiny dataset の行数と runtime の
datapoints=5はまだ不一致です。 - 熱や repeated-run 安定性は未測定です。