phi3-pico-test00 / README.md
kurogane's picture
Update README.md
c0fee43 verified
metadata
license: apache-2.0
pipeline_tag: text-generation
language:
  - ja
  - en
datasets:
  - hotchpotch/fineweb-2-edu-japanese
  - HuggingFaceTB/smollm-corpus
  - HuggingFaceFW/finepdfs
  - OmniAICreator/WebNovels-Ja

概要

Phi3アーキテクチャのモデルです。 context sizeは256です。

dataset

以下のデータセットで1epoch回しました。

バッチサイズ: 140 ステップ数: 2094240 トレーニングトークン合計数: 75B tokens 学習率: 3e-4

tokenizer

Rakuten/RakutenAI-2.0-mini-instructを使用しました。 日本語対応LLMであり、vocab_sizeが48000と学習に使いやすそうだったからです。」