一、环境配置
windows下,使用 conda 新建虚拟环境,使用 pip 进行管理
conda create -n code python=3.10
pip install torch pip install nanochat
pip3 install torch torchvision --index-url https://download.pytorch.org/whl/cu130 pip install tokenizers datasets huggingface_hub tiktoken wandb tqdm numpy
git clone https://github.com/karpathy/rustbpe.git
git clone https://github.com/karpathy/rustbpe.git rustbpe maturin develop --release --manifest-path rustbpe/Cargo.toml
|
二、预训练
wandb login
python -m nanochat.dataset -n 8 python -m scripts.tok_train --max-chars 200000000 --vocab-size 32768 --doc-cap 2000
python -m scripts.base_train --depth=8 --target-param-data-ratio=5 --device-batch-size=2 --run=my_small_pretrain --model-tag=small_d8 --core-metric-every=999999 --sample-every=-1 --save-every=200 --window-pattern L --eval-every -1
|
三、中期训练
torchrun --standalone --nproc_per_node=1 -m scripts.mid_train -- \ --device_batch_size=8 \ --run=dummy
|
四、监督微调
export OMP_NUM_THREADS=1
export NANOCHAT_BASE_DIR="$HOME/.cache/nanochat"
export HF_ENDPOINT=https://hf-mirror.com
mkdir -p $NANOCHAT_BASE_DIR
|
python -m scripts.chat_sft --run=$WANDB_RUN
|
五、本地部署
python -m scripts.chat_web --num-gpus 1 --source sft
|