【Amazon.co.jp限定】 バッファロー WiFi ルーター 無線 LAN Wi-Fi5 11ac ac1200 866+300Mbps IPv6 WPA3 デュアルバンド 日本メーカー 【 iPhone 16e / 16 / 15 / 14 / Nintendo Switch / PS5 動作確認済み 】 エコパッケージ WCR-1166DHPL/N
¥3,380 (2025年4月26日 13:07 GMT +09:00 時点 - 詳細はこちら価格および発送可能時期は表示された日付/時刻の時点のものであり、変更される場合があります。本商品の購入においては、購入の時点で当該の Amazon サイトに表示されている価格および発送可能時期の情報が適用されます。)Scnsuptpモバイルモニター、13.9" ポータブルモニター、3840*2560解像度と防眩スクリーン、コンパクトで携帯性があり、ビジネスマン、学生、ゲームプレイヤー、高輝度400ニット、マットIPSパネル、100%ワイドカラー、スマートフォン/PC/Mac/PS5/4/3/Switch
¥14,999 (2025年4月26日 13:05 GMT +09:00 時点 - 詳細はこちら価格および発送可能時期は表示された日付/時刻の時点のものであり、変更される場合があります。本商品の購入においては、購入の時点で当該の Amazon サイトに表示されている価格および発送可能時期の情報が適用されます。)Amazon Fire HD 8 タブレット - 8インチHDディスプレイ、3GB RAM、32GBストレージ、ブラック
¥15,980 (2025年4月26日 13:09 GMT +09:00 時点 - 詳細はこちら価格および発送可能時期は表示された日付/時刻の時点のものであり、変更される場合があります。本商品の購入においては、購入の時点で当該の Amazon サイトに表示されている価格および発送可能時期の情報が適用されます。)
「DeepSeek-R1」などを開発する中国のAIスタートアップ、DeepSeekの研究者が、一般的な大規模言語モデル(LLM)の推論能力を向上させる新しいアプローチを開発し、査読前の論文をプレプリントサーバーのarXivに公開しました。
[2504.02495] Inference-Time Scaling for Generalist Reward Modeling
https://arxiv.org/abs/2504.02495
DeepSeek unveils new AI reasoning method as anticipation for its next-gen model rises | South China Morning Post
https://www.scmp.com/tech/tech-trends/article/3305259/deepseek-unveils-new-ai-reasoning-method-anticipation-its-next-gen-model-rises
論文によると、DeepSeekは清華大学の研究者と共同で、生成的報酬モデリング(Generative Reward Models:GRM)と、自己原理批判チューニング(Self-Principled Critique Tuning:SPCT)と呼ばれる手法を組み合わせた技術を開発したとのこと。SPCTはDeepSeekの研究者らがGRMをベースに開発した新たなアプローチです。
この技術を使い、明確な質の高い「報酬」を設定することで、さまざまな入力に柔軟に対応できるとのことです。これに伴い推論時間が大幅に短縮され、より良い結果をより速く提供するようになると研究チームは述べています。
新しい技術を組み込んだ「DeepSeek-GRM」というモデルをテストしたところ、いくつかのベンチマークで高いスコアを記録したとのことです。
DeepSeekはGRMモデルをオープンソースにする予定とのことですが、その時期は明らかにしていません。
DeepSeekは2025年1月に推論モデルの「DeepSeek-R1」を発表して大きな注目を集めました。この次世代モデルとなる「DeepSeek-R2」は、2025年5月までに登場する可能性があるとロイターが報じています。
DeepSeekがさらに強化されたAIモデル「DeepSeek-R2」を2025年5月までに前倒しで発表か、さらにAPI利用料を最大75%割引きと発表 – GIGAZINE
この記事のタイトルとURLをコピーする