update model

Browse files

Files changed (17) hide show

.gitattributes +22 -9
Qwen3-0.6B/config.json +3 -0
Qwen3-0.6B/generation_config.json +3 -0
Qwen3-0.6B/merges.txt +0 -0
Qwen3-0.6B/model.safetensors +3 -0
Qwen3-0.6B/tokenizer.json +3 -0
Qwen3-0.6B/tokenizer_config.json +3 -0
Qwen3-0.6B/vocab.json +3 -0
config.yaml +136 -0
configuration.json +3 -0
example/en.mp3 +0 -0
example/ja.mp3 +0 -0
example/ko.mp3 +0 -0
example/yue.mp3 +0 -0
example/zh.mp3 +0 -0
model.pt +3 -0
multilingual.tiktoken +0 -0

.gitattributes CHANGED Viewed

@@ -1,35 +1,48 @@
 *.7z filter=lfs diff=lfs merge=lfs -text
 *.arrow filter=lfs diff=lfs merge=lfs -text
 *.bin filter=lfs diff=lfs merge=lfs -text
 *.bz2 filter=lfs diff=lfs merge=lfs -text
-*.ckpt filter=lfs diff=lfs merge=lfs -text
 *.ftz filter=lfs diff=lfs merge=lfs -text
 *.gz filter=lfs diff=lfs merge=lfs -text
 *.h5 filter=lfs diff=lfs merge=lfs -text
 *.joblib filter=lfs diff=lfs merge=lfs -text
 *.lfs.* filter=lfs diff=lfs merge=lfs -text
-*.mlmodel filter=lfs diff=lfs merge=lfs -text
 *.model filter=lfs diff=lfs merge=lfs -text
 *.msgpack filter=lfs diff=lfs merge=lfs -text
-*.npy filter=lfs diff=lfs merge=lfs -text
-*.npz filter=lfs diff=lfs merge=lfs -text
 *.onnx filter=lfs diff=lfs merge=lfs -text
 *.ot filter=lfs diff=lfs merge=lfs -text
 *.parquet filter=lfs diff=lfs merge=lfs -text
 *.pb filter=lfs diff=lfs merge=lfs -text
-*.pickle filter=lfs diff=lfs merge=lfs -text
-*.pkl filter=lfs diff=lfs merge=lfs -text
 *.pt filter=lfs diff=lfs merge=lfs -text
 *.pth filter=lfs diff=lfs merge=lfs -text
 *.rar filter=lfs diff=lfs merge=lfs -text
-*.safetensors filter=lfs diff=lfs merge=lfs -text
 saved_model/**/* filter=lfs diff=lfs merge=lfs -text
 *.tar.* filter=lfs diff=lfs merge=lfs -text
-*.tar filter=lfs diff=lfs merge=lfs -text
 *.tflite filter=lfs diff=lfs merge=lfs -text
 *.tgz filter=lfs diff=lfs merge=lfs -text
-*.wasm filter=lfs diff=lfs merge=lfs -text
 *.xz filter=lfs diff=lfs merge=lfs -text
 *.zip filter=lfs diff=lfs merge=lfs -text
 *.zst filter=lfs diff=lfs merge=lfs -text
 *tfevents* filter=lfs diff=lfs merge=lfs -text

 *.7z filter=lfs diff=lfs merge=lfs -text
 *.arrow filter=lfs diff=lfs merge=lfs -text
 *.bin filter=lfs diff=lfs merge=lfs -text
+*.bin.* filter=lfs diff=lfs merge=lfs -text
 *.bz2 filter=lfs diff=lfs merge=lfs -text
 *.ftz filter=lfs diff=lfs merge=lfs -text
 *.gz filter=lfs diff=lfs merge=lfs -text
 *.h5 filter=lfs diff=lfs merge=lfs -text
 *.joblib filter=lfs diff=lfs merge=lfs -text
+*.json filter=lfs diff=lfs merge=lfs -text
 *.lfs.* filter=lfs diff=lfs merge=lfs -text
 *.model filter=lfs diff=lfs merge=lfs -text
 *.msgpack filter=lfs diff=lfs merge=lfs -text
 *.onnx filter=lfs diff=lfs merge=lfs -text
 *.ot filter=lfs diff=lfs merge=lfs -text
 *.parquet filter=lfs diff=lfs merge=lfs -text
 *.pb filter=lfs diff=lfs merge=lfs -text
 *.pt filter=lfs diff=lfs merge=lfs -text
 *.pth filter=lfs diff=lfs merge=lfs -text
 *.rar filter=lfs diff=lfs merge=lfs -text
 saved_model/**/* filter=lfs diff=lfs merge=lfs -text
 *.tar.* filter=lfs diff=lfs merge=lfs -text
 *.tflite filter=lfs diff=lfs merge=lfs -text
 *.tgz filter=lfs diff=lfs merge=lfs -text
 *.xz filter=lfs diff=lfs merge=lfs -text
 *.zip filter=lfs diff=lfs merge=lfs -text
+*.zstandard filter=lfs diff=lfs merge=lfs -text
+*.tfevents* filter=lfs diff=lfs merge=lfs -text
+*.db* filter=lfs diff=lfs merge=lfs -text
+*.ark* filter=lfs diff=lfs merge=lfs -text
+**/*ckpt*data* filter=lfs diff=lfs merge=lfs -text
+**/*ckpt*.meta filter=lfs diff=lfs merge=lfs -text
+**/*ckpt*.index filter=lfs diff=lfs merge=lfs -text
+*.safetensors filter=lfs diff=lfs merge=lfs -text
+*.ckpt filter=lfs diff=lfs merge=lfs -text
+*.gguf* filter=lfs diff=lfs merge=lfs -text
+*.ggml filter=lfs diff=lfs merge=lfs -text
+*.llamafile* filter=lfs diff=lfs merge=lfs -text
+*.pt2 filter=lfs diff=lfs merge=lfs -text
+*.mlmodel filter=lfs diff=lfs merge=lfs -text
+*.npy filter=lfs diff=lfs merge=lfs -text
+*.npz filter=lfs diff=lfs merge=lfs -text
+*.pickle filter=lfs diff=lfs merge=lfs -text
+*.pkl filter=lfs diff=lfs merge=lfs -text
+*.tar filter=lfs diff=lfs merge=lfs -text
+*.wasm filter=lfs diff=lfs merge=lfs -text
 *.zst filter=lfs diff=lfs merge=lfs -text
 *tfevents* filter=lfs diff=lfs merge=lfs -text

Qwen3-0.6B/config.json ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:660db3b73d788119c04535e48cf9be5f55bc3100841a718637ae695b442f27dd
+size 726

Qwen3-0.6B/generation_config.json ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:2325da0f15bb848e018c5ae071b7943332e9f871d6b60e2ed22ca97d4cb993d2
+size 239

Qwen3-0.6B/merges.txt ADDED Viewed

The diff for this file is too large to render. See raw diff

Qwen3-0.6B/model.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:ed272ca0a40aa011306dd28becd14c32eeb75cba01db658d3bd5ead894007edd
+size 1503300296

Qwen3-0.6B/tokenizer.json ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:aeb13307a71acd8fe81861d94ad54ab689df773318809eed3cbe794b4492dae4
+size 11422654

Qwen3-0.6B/tokenizer_config.json ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:d5d09f07b48c3086c508b30d1c9114bd1189145b74e982a265350c923acd8101
+size 9732

Qwen3-0.6B/vocab.json ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:ca10d7e9fb3ed18575dd1e277a2579c16d108e32f27439684afa0e10b1440910
+size 2776833

config.yaml ADDED Viewed

	@@ -0,0 +1,136 @@

+model: FunASRNano
+model_conf:
+  lsm_weight: 0.1
+  length_normalized_loss: true
+audio_encoder: iic/SenseVoiceSmall
+audio_encoder_conf:
+  hub: ms
+  freeze: true
+  freeze_layer_num: -1
+  feat_permute: true
+llm: Qwen3-0.6b
+llm_conf:
+  hub: hf
+  freeze: true
+  llm_dtype: bf16
+  init_param_path: Qwen3-0.6B
+  use_lora: false
+  lora_conf:
+    freeze_lora: true
+    task_type: CAUSAL_LM
+    r: 16
+    lora_alpha: 32
+    lora_dropout: 0.05
+    bias: none
+    target_modules:
+      - q_proj
+      - v_proj
+    init_param_path: ""
+audio_adaptor: Transformer
+audio_adaptor_conf:
+  downsample_rate: 1
+  ffn_dim: 2048
+  llm_dim: 1024
+  encoder_dim: 512
+  n_layer: 2
+  freeze: true
+ctc_decoder: Transformer
+detach_ctc_decoder: true
+ctc_decoder_conf:
+  downsample_rate: 1
+  ffn_dim: 2048
+  llm_dim: 512
+  encoder_dim: 512
+  n_layer: 5
+  freeze: false
+ctc_weight: 1.0
+ctc_conf:
+  dropout_rate: 0.0
+  ctc_type: builtin
+  reduce: true
+  ignore_nan_grad: true
+frontend: WavFrontend
+frontend_conf:
+  fs: 16000
+  window: hamming
+  n_mels: 80
+  frame_length: 25
+  frame_shift: 10
+  lfr_m: 7
+  lfr_n: 6
+  cmvn_file: null
+train_conf:
+  use_lora: ${llm_conf.use_lora}
+  accum_grad: 1
+  grad_clip: 5
+  max_epoch: 2
+  keep_nbest_models: 200
+  log_interval: 100
+  effective_save_name_excludes:
+    - llm.
+  resume: true
+  validate_interval: 2000
+  save_checkpoint_interval: 2000
+  avg_nbest_model: 100
+  use_bf16: false
+  use_deepspeed: true
+  deepspeed_config: null
+  save_init_model: false
+optim: adamw
+optim_conf:
+  lr: 5.0e-06
+  weight_decay: 0.0
+scheduler: warmuplr
+scheduler_conf:
+  warmup_steps: 2500
+dataset: FunASRNano
+dataset_conf:
+  index_ds: FunASRNano
+  batch_sampler: BatchSampler
+  batch_type: token
+  batch_size: 6000
+  max_token_length: 3500
+  shuffle: true
+  sort_size: 1024
+  batch_size_scale_ratio_max: 2
+  num_workers: 4
+  audio_adaptor_downsample_rate: ${audio_adaptor_conf.downsample_rate}
+  audio_encoder_downsample_rate: 6
+  data_split_num: 256
+  batch_size_sample_max: 10
+  retry: 2000
+  batch_size_token_max: 6000
+  max_source_length: 12000
+  max_target_length: 2048
+  preprocessor_text: TextPreprocessHasRepeatedWords
+  preprocessor_text_conf:
+    max_ngram_length: 15
+    max_occurrences: 10
+  prompt_classes: MultiContextPrompt
+  prompt_conf:
+    max_neg_hotwords_num: 0
+    min_neg_hotwords_num: 0
+    use_hist: false
+    use_one_pass_result: true
+    use_hotwords: true
+    use_asr_hotwords: true
+    chinese_hotwords_list: null
+    english_hotwords_list: null
+  ctc_tokenizer: SenseVoiceTokenizer
+  ctc_target_normalize: true
+  ctc_tokenizer_conf:
+    vocab_path: null
+    is_multilingual: true
+    num_languages: 8749
+  min_source_length: 10
+  batch_size_scale_threshold: 3000
+  use_dynamic_output_ratio: 0.0
+tokenizer: HuggingfaceTokenizer
+tokenizer_conf:
+  init_param_path: ${llm_conf.init_param_path}
+enable_tf32: true
+debug: false
+train_data_set_list: null
+valid_data_set_list: null
+init_param: null
+output_dir: null

configuration.json ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:b64a3a55d35bcbe2cf4d31f2d3ef25a423d3ba2ebff203298c27fa055f3c7612
+size 398

example/en.mp3 ADDED Viewed

Binary file (57.4 kB). View file

example/ja.mp3 ADDED Viewed

Binary file (57.8 kB). View file

example/ko.mp3 ADDED Viewed

Binary file (27.9 kB). View file

example/yue.mp3 ADDED Viewed

Binary file (31.2 kB). View file

example/zh.mp3 ADDED Viewed

Binary file (45 kB). View file

model.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:90f2548b670216f6ff9828f6b5148dc1cd4dd9a0bb6e3905c58d265212460afb
+size 467729307

multilingual.tiktoken ADDED Viewed

The diff for this file is too large to render. See raw diff