This is a cache of https://b.hatena.ne.jp/entry/s/joisino.hatenablog.com/entry/onedata. It is a snapshot of the page as it appeared on 2025-11-26T14:46:40.312+0000.

[B! LLM] 訓練データ1個だけでLLMの推論性能を倍にする - ｼﾞｮｲｼﾞｮｲｼﾞｮｲ

訓練データ1個だけでLLMの推論性能を倍にする - ｼﾞｮｲｼﾞｮｲｼﾞｮｲ

テクノロジーカテゴリーの変更を依頼記事元:

joisino.hatenablog.com

90users がブックマークコメント

コメント

16

記事へのコメント16件

注目コメント
新着コメント

注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています

規約違反を報告

アプリのスクリーンショット

いまの話題をアプリでチェック！

バナー広告なし
ミュート機能あり
ダークモード搭載

アプリをダウンロード

関連記事

訓練データ1個だけでLLMの推論性能を倍にする - ｼﾞｮｲｼﾞｮｲｼﾞｮｲ

推論能力を高めるためには、LLM の事後訓練で使う訓練データは 1 つで十分かもしれません。本稿では訓練... 推論能力を高めるためには、LLM の事後訓練で使う訓練データは 1 つで十分かもしれません。本稿では訓練データを 1 つだけ使った強化学習についての研究 Reinforcement Learning for Reasoning in Large Language Models with One Training Example（単一の訓練例を用いた大規模言語モデルにおける推論のための強化学習, NeurIPS 2025）について解説します。この研究の結論を直観的に述べると、厳選した数学の問題 1 問の解き方を LLM にひたすら考えさせ続けると高い推論能力が得られるということです。従来の訓練のように様々な問題を用意する必要はありません。たった 1 問を使った訓練で MATH500 という数学ベンチマークに対する正答率が 36.0% から 73.6% に、6 つの数学ベンチマークの平均正答

ブックマークしたユーザー

kojietta2025/11/26
midas365452025/11/26
cantaloupe2025/11/26
hiropppee2025/11/26
hatakazu932025/11/26
zu22025/11/26
misshiki2025/11/26
TakayukiN6272025/11/26
yowa2025/11/26
corner05302025/11/26
stealthinu2025/11/26
rgfx2025/11/26
syou4302025/11/26
tachisanhtn2025/11/26
mskkwsm2025/11/26
otchy2102025/11/26
fraction2025/11/26 $fraction$
yuiseki2025/11/26

同じサイトの新着

同じサイトの新着をもっと読む

いま人気の記事

いま人気の記事をもっと読む

いま人気の記事 - テクノロジー

いま人気の記事 - テクノロジーをもっと読む

新着記事 - テクノロジー

新着記事 - テクノロジーをもっと読む

いま人気の記事 - 企業メディア

企業メディアをもっと読む

設定を変更しましたx