けん玉 X: @kendama_ai
すでぃー X: @sudy_super
168GB
テーマ: 日本語instruction-tuning/RLHFデータセット生成を目的とした指示生成モデルと応答生成モデルの作成、及びモデルの出力を使ったデータセットの作成
一般に、LLMの対話タスクにおける精度は事前学習データとその後のFine-tuningに使われるinstructionデータのクオリティに大きく左右されます。
しかし、日本語のinstructionデータセットは英語に比べると数が少なく、その中でもオープンソースで高品質なものに限定すると、学習を行うのに十分な数が揃わないのが現状です。
そこで私たちのチームは、指示生成と応答生成に特化したモデルをそれぞれ作成することで、データそのものに留まらず、「高品質なデータ"生成"の民主化」を目指します。