This is a cache of https://b.hatena.ne.jp/entry/s/joisino.hatenablog.com/entry/zeh. It is a snapshot of the page as it appeared on 2026-02-02T18:49:08.105+0000.

[B! LLM] LLMの能力の「穴」 - ｼﾞｮｲｼﾞｮｲｼﾞｮｲ

LLMの能力の「穴」 - ｼﾞｮｲｼﾞｮｲｼﾞｮｲ

テクノロジーカテゴリーの変更を依頼記事元:

joisino.hatenablog.com

162users がブックマークコメント

コメント

23

記事へのコメント23件

注目コメント
新着コメント

注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています

規約違反を報告

アプリのスクリーンショット

いまの話題をアプリでチェック！

バナー広告なし
ミュート機能あり
ダークモード搭載

アプリをダウンロード

関連記事

LLMの能力の「穴」 - ｼﾞｮｲｼﾞｮｲｼﾞｮｲ

本稿では Even GPT-5.2 Can't Count to Five: The Case for Zero-Error Horizons in Trustworthy LLMs ... 本稿では Even GPT-5.2 Can't Count to Five: The Case for Zero-Error Horizons in Trustworthy LLMs をもとに、最先端の LLM が未だにごく簡単な問題ですらミスすることを議論します。具体例としては、11000 に含まれる 1 の数が偶数か奇数か聞くと、gpt-5.2-2025-12-11 は奇数と答えます。また、((((()))))) のカッコのバランスが取れているか聞くと、取れていると答えます。127×82 を計算させると、10314 と答えます（正解は 10414）。このことは以下のコマンドで確認できます。 $ curl -s https://api.openai.com/v1/responses \ -H "Authorization: Bearer $OPENAI_API_KEY" \ -H "C

ブックマークしたユーザー

pure_luca2026/02/02
dorapon20002026/02/02
sora05132026/02/01
knj29182026/01/31
hush_in2026/01/30
tomohiro3h2026/01/29
John_Kawanishi2026/01/29
ookitasaburou2026/01/29
akishin9992026/01/28
TakayukiN6272026/01/28
zu22026/01/28
tetokon2026/01/28
ryousanngata2026/01/28
kazuya0302026/01/28
misshiki2026/01/27
fumirui2026/01/27
whalebone2026/01/27
tachisanhtn2026/01/27

同じサイトの新着

同じサイトの新着をもっと読む

いま人気の記事

いま人気の記事をもっと読む

いま人気の記事 - テクノロジー

いま人気の記事 - テクノロジーをもっと読む

新着記事 - テクノロジー

新着記事 - テクノロジーをもっと読む

いま人気の記事 - 企業メディア

企業メディアをもっと読む

設定を変更しましたx