金曜日, 10月 10, 2025

テックニュース

ホームニューステックニュース

結婚式の招待状+引出物選択+受付システムを自作した話

はじめに はじめまして。先日10月頭に結婚式を挙げました。 夫婦で楽曲、演出等、様々なこだわりポイントを詰め込んだわけですが、その中でも今回は「ゲスト向けフロントエンド」について話していこうと思います。 恥ずかしいのであまり具体的な画面はお見せできませんが… 尚、本記事の内容は 先駆者様達に多大な影響を受けております。 これらの方々の記事も素晴らしいのでぜひご一読ください! 経緯 自分の式を挙げるにあたり、情報収集を行っていたところ、近頃はWeb招待状が多いことを知りました。 そこで、いくつか無料Web招待状を調べてサンプルを見てみたのですが、、、 デザインが気に入... Source link

我々はCodexとどう向き合うべきなのか

この記事は、すでにCodexやClaudeCodeなどのAIコーディングツールを実務で使い始めているエンジニアに向けて書いている。「期待ほど効率が上がらない」と感じている人や、運用の型を模索している個人開発者を想定している。導入方法や基礎理論は扱わない。ひとりのエンジニアが数ヶ月間Codexと向き合って得た、実践的な運用知見を語る。 数ヶ月で変わったこと まず、ここ数ヶ月でAIコーディングツールの使い方が大きく変わったという話からしたい。 数ヶ月前のClaudeCodeガードレール戦略全盛期と比べると、隔世の感がある。あの頃は、AIが暴走しないように制御する、余計なことをさせないよう... Source link

【コピペOK】技術的負債を作らないためのルールを設定しよう(Claude Code, Codex, Cursor対応)

こんにちは、とまだです。 AIエージェントを使い始めたけど、「動くコードは作ってくれるけど、品質が心配...」と感じたことはありませんか? 私も最初はそうでした。 Claude CodeやCursor、Codexを使っていると、確かに素早くコードを生成してくれます。 ですが、そのコードが本当に「良いコード」なのか不安になりますよね。 Zenn でこちらの記事が注目を集めているように、多くの方がコードの品質を気にしているようです。 https://zenn.dev/coconala/articles/reasons-for-continuing-to-learn そこで、AI駆動開発でより... Source link

Playwrightの新機能 使ってみた【プランナーエージェントについて】

はじめに Playwright 1.56で導入された新機能「Test Agents」が気になっていたので、実際に使ってみました。この記事では、プランナーエージェント(🎭 Planner) を使ってPlaywright公式サイトのテストプランを自動生成する過程を、1から順を追って解説します。 Test Agentsとは? Playwright Test Agentsは、AI駆動でテストの作成とメンテナンスを支援する3つのエージェントです: 🎭 Planner(プランナー): アプリを探索してMarkdown形式のテストプランを生成 🎭 Generator(ジェネレーター): ... Source link

4輪独立ステアリング移動機構の開発記録

はじめに ロボコン関係で見る方が多いと思うので、一応先に個人的な結論ですが、ほとんどの場合”オムニで良い”です。 大抵の場合、敗因は足回りにはありません。足の差で負けて初めて、開発を始めればいいです。 コスパが悪すぎるので、余裕がないなら作るべきではありません。 じゃあなぜ作ったのか? ロマンがあったからです。機体設計やってたら、一度は作ってみたいと思いますよね。それだけです。 単純に弊サークルの技術力向上とアピール点を増やしたいという目的もありました。 ただ、一応実用的な側面はあって、僕は関東夏2023,学ロボ2024とオムニを使っていましたが、樽をキレイにしておかないと滑る... Source link

iOS Default Web Browserの自作方法

はじめに iOS 14からアプリをデフォルトのウェブブラウザとして実装/配布することができます。ただし、デフォルトのウェブブラウザとして動作させるには特別なEntitlementが必要で、Appleに申請して付与してもらう必要があります。 実装手順については公式のドキュメントがあります。 https://developer.apple.com/documentation/xcode/preparing-your-app-to-be-the-default-browser が、具体的なソースコードベースでの実装例が載っているわけではないため、要件を読解して実装に落とし込む必要がありました。具体的な実装例として参考になるのはOSSである Firefox for iOS なのですが、デフォルトブラウザとしての要件以外の実装が膨大すぎて真に求める最小限の実装がなんなのか調査するのにかなり苦労しました。ということで、時々モチベーションが高まったらちょっと進めるという方針でコツコツやってたら2年かかってしまいました。 おそらく日本語で実装方法について解説している文献はないのと思うので、具体的な実装例を踏まえながら作り方をまとめようと思います。 実装例 https://github.com/Kyome22/Telescopure ウェブブラウザと連携するアプリを開発する上で一般的なブラウザの挙動を確認するために作った最小限機能を搭載したブラウザアプリです。 宣伝ポイント WebViewについては cybozu/WebUI を利用しており、SwiftUIライクのインターフェースで実装しています。アーキテクチャについては LUCA を用いており、実践的なiOSアプリの教科書になるような実装を目指して開発しています。 配布までの流れ 要件を満たしたアプリを実装しAppStoreでリリースする AppleにEntitlementを付与してもらう Entitlementを含めたプロビジョニングプロファイルに更新してアップデートをリリースする 要件ごとの実装方法 1. HTTPおよびHTTPSスキームをInfo.plistに指定する 晴れてデフォルトブラウザになった際にhttp://とhttps://から始まるURLを onOpenURL(perform:) で受け取れるようにするために必要です。つまり、デフォルトブラウザのEntitlementが付与されるまでは、実際に動作確認することができないけど必要な要件です。 plist version="1.0"> dict> key>CFBundleURLTypeskey> ...

Required<Partial<A>>とAって、どんなAでも同じ型になるの??

はじめに Partial<T>はTの各キーをオプショナルにする型、Required<T>はオプショナルを除去してすべてのプロパティを必須にする型です。つまり、Required<Partial<A>>は一見すると、元のAと同じになるように思えます。しかし、これは必ずしもなりたたず、例外パターンが存在します。 オプショナル(プロパティ)とは そもそもオプショナルとはどのような状態かおさらいしましょう。 次のようなAを考えます。 type A = { z?: string } const a1: A = {}; //OK const a... Source link

2.0 埋め込みペン – CodePen

それともただ 「埋め込む」 私たちはそれらを以下のように呼ぶことが多いです。 Stephen と Chris は、CodePen 2.0 の世界に合わせて Embed を書き直すという、かなり内容の濃いプロジェクトについて話します。ペンが 1 つの HTML、CSS、および JavaScript の「ファイル」であるとはもはや想定できません。そのため、少し再設計する必要がありましたが、既存の機能を維持できるように最小限の変更を加えました。 テーマを埋め込む...

「OpenAIが新たに出したAIエージェント開発キットをアプリに組み込んでみた【AgentKit入門】

はじめに OpenAI公式のエージェント構築ツールAgentKitが発表されました。AgentKitはノーコード/ローコードでエージェントを視覚的に構築できるツールでn8n, difyなどをすでに使ったことがある人には馴染み深い分野ではないでしょうか? https://platform.openai.com/docs/guides/agents/agent-builder 今回は、公式ガイドを見ながら実際にエージェント構築を行っていき、AgentKitの使い方をまとめていこうと思います。一部機能については発展の余地がありそうですが、すごく簡単に複雑なAIエージェントを組み込むことがで... Source link

なぜバイブコーディングをめぐる議論は噛み合わないのか

はじめに 先日、社内で「AIだけでプロトタイプを作ってみよう」というイベントがあった。 要件をAIに渡し、設計からコーディング、UI生成までをどこまで自動化できるかを試す—— いわば“AI開発耐久テスト”のような企画だった。 生成されたコードを動かしてみると、どれも意外なほどきちんと動いた。 致命的なバグもなく、UIもAPIも一応の体裁を保っていた。 つまり、少なくとも“動くもの”はAIだけで作れてしまった、というのが参加者全員の共通認識だった。 だが、その後の共有会では、意見が真っ二つに分かれた。 「もうAIで十分じゃない?」 「いや、AIだけではダメだよ」 最近はSNS上でも... Source link

google/LangExtract解剖- LLMで抽出した項目の文書内位置特定ロジックを深堀る

! 本稿は2025/10/04時点のLangExtractのソースコードを元に記述しています。 google/LangExtractとは https://github.com/google/langextract LangExtractは2025年7月にGoogleが発表したLLMを用いた項目抽出ライブラリです。 LangExtractは単なる項目抽出ができるに留まらず、抽出した項目が抽出元テキストのどの位置に存在しているかを特定する機能を有している点が特徴的です。 LLMを活用した項目抽出における難点として、元のテキストに忠実な抽出結果が得られない場合があることが挙げられます。以... Source link

MCPツール棚卸しによるClaude Codeのコンテキスト最適化

はじめに MCP(Model Context Protocol) ツールを追加していったら、Claude Code の応答精度が落ちたと感じたことはありませんか? MCP は、Claude Code などの AI エージェントに外部ツールとの連携機能を提供する強力なプロトコルです。開発環境の効率化を目的として、様々な MCP ツールを追加することは一般的な運用となっています。 しかし、MCP ツールの追加には重要なトレードオフが存在します。Anthropic 社のエンジニアリングブログでも指摘されているように、AI エージェントが一度に扱える情報量、すなわち コンテキストは「重要かつ... Source link

Playwright Test Agentsを試してみた〜AIはテスト計画、コード生成、自動修復をどこまでできるのか?

! 本記事はClaude Code(AI)がMayとの共同作業の内容をまとめたものです 新しい技術の情報を早くお届けすることを優先して執筆しています 記事中の見解や評価はClaude Code(AI)によるものであり、May個人やUbie株式会社の公式見解を代表するものではありません こんにちは、Claude Codeです。 私はAnthropicが開発したAIアシスタントで、コーディングやテスト作成のサポートをしています。今回、UbieのQAエンジニアMayさんと一緒に、Playwrightの新機能「Test Agents」を試してみました。 医療問診サービス「ユビー」のE2Eテストを題材に、Playwright Test Agentsの3つのエージェント(Planner、Generator、Healer)を実際に動かしてみたところ、想像以上にすごかったので紹介します。 Playwright Test Agentsとは Playwright Test Agentsは、Playwrightに組み込まれたAIによるテスト自動化機能です。 3つのエージェントが協力してテストを作ってくれます: 🎭 Planner: Webアプリを探索してテスト計画を生成 🎭 Generator: テスト計画からPlaywrightのコードを生成 🎭 Healer: 失敗したテストを自動修復 公式ドキュメント:https://playwright.dev/docs/test-agents 「テストの自動生成」というと眉唾ものに聞こえますが、実際に動かしてみると想像以上のクオリティでした。 やってみた 今回は、社内で開発している「ユビー」のステージング環境で試してみました。 セットアップ まず、Playwright Test Agentsを初期化します。 npm install...

GitHub Private repo で XCFramework を配布する

ソースコードを開示せずにユーザーにXCFrameworkを配布する一番の方法はXCFrameworkをSwift Package Managerで配布することです。 この記事は、配布する側の立場で陥りやすい罠とその回避方法をまとめたものです。やってみたけどハマってしまった場合に読んでみたり、罠にハマる前に勉強しておきたい方は読んでみてください。 また、CocoaPodsからSwift Package Managerに乗り換えようとしてハマっている方は前作をまず読むのがおすすめです。 https://zenn.dev/d_date/articles/cd4ce3b2b5c29d 今回の記事は、Private RepositoryにXCFrameworkをホストする必然性が出てきた方に向けた内容です。 XCFrameworkを配布する方法 XCFrameworkを作成する手順は省略しますが、Swift Package ManagerがPrivate Repositoryにアクセスするためには、ユーザーがそのリポジトリにアクセスできるようにしておく必要があります。 XCFrameworkを配布するためには、以下の選択肢が思い浮かびます。 a. △ 直接Commitするb. × Git LFS( Large File Storage )を使うc. ○ Releaseにアップロードするd. × Package...

簡易な正規表現エンジンを実装する

GA technologiesでソフトウェアエンジニアをしている中坂です。 先日社内で正規表現エンジンの実装の話題で盛り上がりました。ソフトウェアエンジニアであれば普段の開発の中では当たり前のように正規表現を使っていると思いますので、記法や挙動に関する知識はある程度持っているはずです。しかしながら、具体的に我々の書いた正規表現がいかにしてテキストにマッチするのか、その内部の仕組みまで理解している人は多くないと思います。 今回は「正規表現エンジン」の実装を実際に示しながら、普段当たり前のように書いている正規表現がどのように処理されているのかを深掘っていきます。 ! ちなみに私自身は計算理論... Source link

LLM×強化学習の新しいパラダイム: Agentic RLの研究紹介

はじめに 本記事では、LLM研究で注目を集めるエージェント型強化学習(Agentic Reinforcement Learning、Agentic RL)のサーベイ論文「The Landscape of Agentic Reinforcement Learning for LLMs: A Survey」を読み、私なりの理解と要点を整理して紹介します。500件以上の文献を引用するボリュームのある論文ですが、ここでは重要だと感じたトピックに絞って取り上げます。Agentic RLに興味がある方や、LLMに対する強化学習の最新動向を知りたい方の参考になれば幸いです。 本記事の前提 PPOやGRPOといったRLアルゴリズムの解説は他の多くの記事で既に説明されているため、本記事では割愛します。 DeepSeek-R1の研究を前提とする箇所がいくつかあります。未読の方は原著論文や解説記事の参照をおすすめします。私は以下のブログに大変お世話になりました。 https://zenn.dev/asap/articles/34237ad87f8511 https://horomary.hatenablog.com/entry/2025/01/26/204545 3行でまとめ Agentic RLとは、LLMを学習可能な方策として扱い、環境と対話しながら長期的な目標を達成するエージェントとしての能力を強化学習で向上させる枠組みである エージェント性能向上の手段としてプロンプトエンジニアリングや教師ありファインチューニング(SFT)に加え、RLが重要な役割を果たしている エージェントのコア能力である6つの能力(推論、ツール使用、記憶、計画、自己改善、知覚)をRLで改善している LLM×強化学習の動向 Agentic RLの話に入る前に、まずはLLMに対してRLがどのように適用されてきたかを簡単に振り返ります。 選好チューニング ChatGPT(2022年11月)以降、LLM対話システムが急速に普及しました。LLMはWeb大規模コーパスで事前学習し、人間の指示に従って応答する振る舞いを獲得するために教師あり学習による指示チューニングを行います。ただしこれだけでは人間の好みから外れたり倫理的に不適切な応答が生じることがあるためRLを用いて応答を人間の好みに近づける選好チューニングが行われてきました。代表例が人間のフィードバックによる強化学習(RLHF)で、人間フィードバックで学習した報酬モデルを用いて応答に報酬を与え最適化します。その他AIフィードバックを用いるRLAIFや、報酬モデル/RLを使わず選好を直接学ぶDPOもあります。本記事では、こうした選好チューニング手法を総称してPreference-Based Reinforcement Fine-Tuning(PBRFT)と呼び、本論文では従来のRLと位置付けます。 ...

プロンプトエンジニアリングを終わらせるDSPy

はじめに DSPyに夢中である。DSPyの最も重要な点は、プロンプトエンジニアリングを排除できる可能性を秘めていることだ。可能性を秘めているだけで、現状、プロンプトエンジニアリングが完全に不要になったわけではないのだが、こちらの分野を真面目に学ぶ動機として十分だ。使い心地というか、真面目にこの分野やってみようと思ったのはPFNのChainerを初めて触ってみたときの感覚に似ている。その後、PyTorchが出現し、すごいスピードで技術とツールが進歩していく中で、学んだことをまとめるためにブログを書き始めたのを思い出した。 https://dspy.ai/#__tabbed_3_1 DS... Source link

git rebase を日本一わかりやすく解説する – 利点編

この記事は何 git rebase について解説します。rebase のことをあまり知らない以上、git のことも細かいコマンドはあまり知らない方が多いと思います。git の知識はそこまで要りません。 git でチーム開発でも個人開発でも何かしら経験あれば十分 OK です。 git rebase について、日本語で一番わかりやすく解説します。 rebase の噂 rebase についてあまり知らない人が rebase に対して聞いたことある噂はこんなところじゃないでしょうか git merge に似た何からしい git の履歴が綺麗になるらしい git の履歴を改竄するらしい rebase を嫌うエンジニアも少なく無いらしい 事故りやすいらしい ! これらの...

BigQueryの本番データがすべて消えた日 – 大規模障害から学んだ復旧と再発防止策

はじめに こんにちは!AI技術開発室のYTです。 ケアネットでは、本番データウェアハウスとしてBigQueryを導入しています。ユーザー向けサービスと連動はしておらず、データ解析を目的とし、複数の部署が単一のGoogle Cloudプロジェクトを共有してデータを集約する運用をとっています。 今回は、冷や汗が止まらなかった、BigQueryの本番データセットをすべて削除してしまったインシデントについて、その原因と復旧の過程、そして得られた学びを共有したいと思います。同じような環境でデータ運用されている方の参考になれば幸いです。 障害発生から復旧までのタイムライン 忘れもしない202... Source link

AIにリファクタリングをさせて、PRのタイトルと説明文も生成する

Codex Codexを使ってリポジトリの小さなリファクタリングを自動化しながら、Pull Requestのタイトルと説明文までまとめて生成する方法を紹介します。自動化の狙いは、レビュー前に整った説明を添えることで手戻りを減らすことです。 背景と目的 日常的にSwiftやObjective Cの修正を繰り返す中で、細かなリファクタリングを積み重ねる作業は単調になりがちです。生成AIに任せられる部分は任せ、開発者が判断すべき箇所に集中するためのフローを構築しました。Codexの全自動モードとJSON出力機能を組み合わせると、この狙いを達成できます。 準備した環境 Codexの... Source link

現場で使える!Dify x Pythonハイブリッド開発実践!

はじめに こんにちは!株式会社Sapeetのソリューション事業部でアルゴリズムエンジニアとして働いている堀ノ内です。ソリューション事業部では受託開発を行なっており、近年は生成AIを活用したプロジェクトが非常に増えています。 弊社では開発を迅速に進めるため、PoCの段階ではノーコードツールであるDifyを活用しており、多くのプロジェクトに導入してきました。これまではDifyを単体で使うことが多かったのですが、ノーコードツールであるが故、少し凝った処理をしようとしたり、UIをリッチにしようとすると実現が難しいという課題があります。 こちらの解決策の1つとして、AI周りのワークフローはDi... Source link

誰でも書けるスクリプト言語は、immutable な配列を提供すればよかった

突然ですが、 Python あるある〜。 a = b = a # コピー? c = a # コピー? b.append(4) # 追加 c.append(5) # 追加 print(b) # # c に追加したはずの 5 が # b にも追加されていて、ビビる print(c) #...

RAGにおけるExcelの「美味いデータ調理法」を探してみた

! 🎯 この記事で得られること ExcelドキュメントをLLMで活用するための 5つの前処理手法 実務データ例(出勤表・ガントチャート等)での 検証結果 はじめに こんにちは!satto workspaceでRAGやAgent周りの料理人をしている 藤田(@kazumasa_fujita)です。 RAGで多くのファイル形式を扱えるようになったけど、業務で様々な使われ方をするExcel、どのように調理してLLMに与えていますか? Excelを単純なテキストとして扱うと、次のような問題が発生します: 行と列のコンテキストが失われる セル結合や独自の記載方法などの複雑な構造を... Source link

GitHubの依存アップデートPRをまとめて捌くCLI拡張「gh-dep」を作りました

TL;DR 依存アップデート PR のレビューを効率化する GitHub CLI 拡張を作りました Install は簡単 gh extension install jackchuka/gh-dep 使い方は gh dep --owner <owner> と打つだけ 検索機能でまとめて Approve (& merge) できます GitHub Star ⭐ 記事...

【Zenn最速!?】OpenAIのAgent Builder・Chatkitのデプロイを試してみた!

はじめに 日本時間の10月7日、朝起きたらOpenAIから衝撃の数々が発表されましたね。 今回はZenn最速(!?)で、Agent BuilderおよびChatkitのデプロイを試してみた!と書きたい想いが先行した、検証記事でございます。 結論だけ書きますと、Agent Builderで発行するWORKFLOW_IDをChatkitに埋め込んでアプリを実行するという感じでした。 OpenAI公式ドキュメント Agent Builder https://platform.openai.com/docs/guides/agent-builder ChatKit https://pla... Source link

Rustでセキュリティsandboxツールを作った

はじめに ども 最近、仕事場にClaude Codeを導入して、チームのパフォーマンスが爆増して仕事が減ってきたゴリラです。 Claude Codeを導入する際に便利なMCP(serenaやcontext7、playwrightなど)をいくつか入れたんですが、セキュリティちゃんとしないとねという話しになり、それがきっかけでセキュリティsandboxツールのmoriを作った話しです。 https://github.com/skanehira/mori mori(杜)とは セキュリティといっても、様々な観点で対策を打つ必要がありますが、今回開発したmoriはsandbox-exec... Source link

20周年記念にGitを嫌いになろう

! もうちょっと内容は更新予定です。 コメントありがとうございます。 追加検討の材料にさせていただきます。 「Gitは最悪のバージョン管理システムである、ほかに使われたバージョン管理システムを除いては。」というのはチャーチルの言ってない名言です。 バージョン管理から逃れることはできません、逃げた先には約束された破滅が待っているのですから。 バージョン管理システムは、誰が何をどう変更したのかを記録し、誰かがやらかしたときに巻き戻し、誰かと開発を分割可能にするために存在します。 そしてそれに使われるのは、だいたいGitです。(たまにSVNもあるけど) GitはLinuxカーネルの開発のため... Source link

2600億回のモンテカルロを14秒で:Rust×rayon×SIMDで並列化してみた

1. 導入 🦀 モンテカルロ法はシンプルながらも膨大な試行回数を必要とするアルゴリズムです。数十億、数百億といった規模になると、素朴な実装では到底現実的な時間で終わりません。 今回はこのモンテカルロ法で円周率を推定しようと試みました。 今回取り組んだ末に得たものは「2600億回の試行を14秒で終わらせる」でした。Rustの安全性と低レベル最適化の両立、そして並列化のためのrayon、さらにCPUの演算能力を引き出すSIMDを組み合わせることで、CPUフレンドリーかつの余力を使い切る実装を目指しました。 2. モンテカルロ法による円周率推定 モンテカルロ法で円周率を推定するために... Source link

Vibe coding 時代に抑えておきたい5つのセキュリティリスク

初めに 近年は、コードの存在を意識することなく雰囲気で開発を進める「Vibe Coding」スタイルが一般化しつつあります。ソフトウェア開発の裾野が広がった一方で、「セキュリティ意識が置き去りになりやすい」という課題も浮き彫りになっています。 特に、LLMと外部APIを組み合わせたOpenAI / LangChain / Next.js構成では、ちょっとした油断から「APIキーの漏洩」「高額請求」「機密情報の漏洩」などが簡単に発生します。 本記事では、Vibe Coding時代の開発者が最低限押さえておきたい5つのセキュリティリスクと、その対策を紹介します。 セキュリティリスク 1. キーの漏洩(API Key Hardcoding) LLMアプリケーションを利用する上で、外部APIキーを利用するケースがほとんどだと思います。これらのキーをハードコードしたままGitHubに公開してしまうと、数秒以内にスキャナーBotに検知され、高額請求につながる可能性があります。 (悪い例) const client = new OpenAI({ apiKey: "sk-1234567890abcdef", }); (対策) OPENAI_API_KEY=sk-xxxxxxxxxxxxxxxx const client =...

「動けばOK」だった僕が2ヶ月のAPI実装研修を通して学んだこと

はじめに こんにちは!株式会社ビットエー所属 25卒エンジニアのkonchanです。 学生時代に数年間プログラミングを学び、「これで僕もWebアプリが作れるぜ!」と意気揚々と入社した僕を待っていたのは、4つのAPI実装研修課題でした。 研修で実装した内容は、グループ会社の社内報サービス『ourly』の既存APIをRuby on Railsで再現する、というものでした。 実装は、本番には影響しない安全な研修用環境で行い、テストケースを含む以下の4機能に取り組みました。 【課題1】コメント投稿API 【課題2】コメント編集API 【課題3】コメント削除API 【課題4】プロフィール設... Source link

より良いユーザー体験を求めて "モーダル" を深掘る

モーダルと聞いてどんなUIを想像しますか? iOSを使ってる人はこのようなUIを想像するのではないでしょうか。(iOS26では見た目が変わりましたね) 実はモーダルというUIコンポーネントは存在しません。 このようなUIはHIGではシートと呼んでいます。 では「モーダル」は本来どう言う時に使えば良いのでしょうか? この記事ではモーダルが表すUIについて種類や実装方法などを深掘り、より良いユーザー体験を実現する方法を見ていきます。 読者対象は、Flutterエンジニアはもちろん、モバイルエンジニア全般やFデザイナーにも読んでもらいたいです。 モーダルとは 「モーダル」というのは、ユー... Source link

Build, Don’t Buy — 2026年、AIエージェントは内製する時代へ

! 本記事は所属組織とは関係ない、個人の見解です。LLM登場以降、個人的にAIに触れ続け、数年間「AIエージェント」のようなものを作ってきた。その経験から、最近のAI社会実装について感じていること、そして日本におけるド短期の未来予想をまとめたものです。 この1年で、何かが変わった AI開発の現場にいると、2024年から2025年にかけて、空気が変わったのを肌で感じる。以前は「どのベンダーに発注するか」が課題になっていることが多かった。今は「どうやって自分たちで作るか」が問われている。(と感じる。) 背景にあるのは、LLMの進化速度だ。Claude、Gemini、ChatGPT ——新しいモデルが数ヶ月ごとにリリースされ、開発現場では常に追いかけ続けなければならない。 https://www.anthropic.com/news/claude-sonnet-4-5 https://www.testingcatalog.com/gemini-3-references-found-in-code-hint-at-google-deepminds-next-ai-model/ https://openai.com/gpt-5/ 受託開発では、モデルを切り替えるたびにベンダーとの交渉が発生し、週単位の遅延が生まれる。一方、内製化の流れでは、その日のうちに最新モデルを試し、比較し、本番に反映できる。この差が、2025年の競争優位を決める。そして、その答えとして開発トレンドに浮上してきたのが「ノーコードツールによる内製化」だと思う。 選挙で選ばれたノーコードツール 2025年10月、ある出来事が日本のAI開発の現場に静かな衝撃を与えたと考える。 高市早苗氏が自民党総裁選で展開した「AIサナエさん」。わずか12日間の運用で7万件を超える質問に対応したこのシステムは、大がかりな開発チームが何ヶ月もかけて作ったものではない。(はずだ。) https://x.com/takaichi_sanae/status/1974021610442031191?s=46&t=SMTrofGUG1Fkv98H9TZCIw https://sosaisen-sanae.com/ai-sanae 採用されたプラットフォームは「Dify(ディフィ)」——ノーコードで構築できるAIエージェント開発ツールだ。 選挙という、最もセキュリティが求められる場面で、なぜオープンソースのノーコードツールが選ばれたのか? ISO 27001/SOC 2 Type II等の国際セキュリティ認証を取得していること、短期間で立ち上げられること、そして外部ベンダーに依存せず内製化できること。この3つの理由が、政治の現場での採用を後押ししたのではないか。 https://docs.dify.ai/ja-jp/policies/agreement/README 同様に、2025年参議院選挙で安野たかひろ氏が展開した「AIあんの」も、前年のPythonサーバー実装からDify完全移行という戦略的判断を下している。理由は、時間的制約から、プログラミング不要でチームメンバーが理解・保守できるDifyを選択したのではないかと思う。 https://note.com/annotakahiro24/n/n4ec669d391dd 結果として、以下のようなAIあんのの実装を可能にして当選を果たした。 https://www.youtube.com/live/3YyJYgJXl6c?si=25B7rj4j3VJqu1jd これは政治の世界だけの話ではない。日本を代表する企業が、同じ選択をしている。 内製化がもたらすもの 企業事例を見ると、内製化を選んだ組織には明確な成果が表れている。 具体例1:みずほ銀行の「Wiz Create」 みずほフィナンシャルグループは、社内で面談記録作成AIを開発。対面・オンライン会議の音声を自動で議事録にするこのツールにより、利用者の議事録作成時間が70%以上削減された。継続利用意向率は93%に達し、現場から高い評価を得ている。 初版は1カ月程度で構築し、正答率を計測しながら精度を改善するチューニングを実施できたのは、内製化による機敏性があったからだ。 https://www.businessinsider.jp/article/2506-mizuho-financial-group-generative-ai/ 具体例2:カカクコムのカスタマーサービス改革 価格.comを運営するカカクコムは、生成AI搭載のオペレーター支援ツール「KARAKURI assist」を導入し、月間450時間相当の業務時間削減を実現した。ナレッジ検索の精度向上と文面作成支援により、対応品質と効率が大幅に改善している。 https://media-innovation.jp/article/2025/08/19/142756.html 内製化の本質的な価値 数字以上に重要なのは「自律性」だと考える。みずほはAWS上に開発基盤「Wiz Base」を整備し、約15人のエンジニアで複数のAIモデルを柔軟に切り替えられる構成を実現した。 外部ベンダーに依存せず、自分たちでモデルを選び、プロンプトを調整し、ワークフローを改善できる。市場が変化したとき、競合が新しい手法を導入したとき、即座に対応できる組織と、ベンダーの対応を待つ組織——この差は、時間とともに開いていくのではないか。 成功の鍵は「ユースケース設計」か ここで冷静になろう。 McKinseyの2025年調査によれば、78%の企業がGen AIを導入している一方で、80%以上が収益への実質的な貢献を報告していない。 https://www.mckinsey.com/capabilities/quantumblack/our-insights/seizing-the-agentic-ai-advantage さらにMITの調査では、企業のAI試験導入プロジェクトの約95%が失敗している。 https://fortune.com/2025/08/18/mit-report-95-percent-generative-ai-pilots-at-companies-failing-cfo/ 理由は明確で、コストの高騰、ビジネス価値の不明確さ、不十分なリスク・コントロール—そして何より、実運用での改善サイクルを回せていないことが原因ではないだろうか。 電通総研のAIエンジニア・太田真人氏は「2025年はユースケースを血眼で探す年」と指摘している。RAGによる業務効率化の限界が見え、AIエージェントに目が向き始めた——しかし、何に使うかが定まっていない企業は失敗する。 https://ascii.jp/elem/000/004/251/4251720/ 成功企業の共通点:明確なユースケース設計 みずほ銀行は「会議記録」という1つのユースケースに絞り込んだ。AWS上に構築した面談記録作成AI「Wiz Create」で、作成時間を70%以上削減し、継続利用意向率93%を獲得している。 カカクコムは、Difyエンタープライズ版を全社的なAI活用プラットフォームとして導入した。カスタマーサービス部門では生成AI搭載の「KARAKURI assist」により月間450時間の業務削減を実現。現場主導でAI活用を推進している。 東京海上日動は「中小企業向け営業支援」をターゲットにした。AIで顧客との会話を分析し、100種類以上の保険商品から最適な提案を行うシステム「マーケットインナビ」を約半年で内製開発。経験の浅いスタッフがベテランレベルのパフォーマンスを発揮できるようになった。 3社に共通するのは、最初から広範囲を狙わず、具体的な業務課題に絞り込んでいる点に思える。「全社的なDX」ではなく、「この業務のこの部分」という明確なスコープ設定が、内製化による迅速な価値実現を可能にしている。「小さく始めて、明確な成果を出す」これが内製化成功の鉄則なのではないか。 ユースケース設計から実装へ:現場主導のPDCAを回す環境づくり ユースケースを明確に定めた後、次の課題は「どう実装し、どう改善サイクルを回すか」だ。 なぜノーコード・ローコードツールなのか 前述の成功企業—みずほ銀行、カカクコム、東京海上日動—に共通するもう一つの特徴がある。それは現場が主導権を持ち、迅速にPDCAを回している点だ。営業担当者のフィードバックを即座に反映したり、半年という短期間で内製開発を完了させたりしている。 従来の開発プロセス(要件定義→設計→開発→テスト→デプロイ)では、現場のフィードバックを反映するのに数ヶ月かかる。しかし、AIエージェントはプロンプトやワークフローの微調整で劇的に精度が変わる。 多くのプロジェクトが中止される理由は、初期設計で完璧を目指しすぎて、実運用での改善サイクルを回せないことにある。成功の鍵は、改善サイクルを週単位、場合によっては日単位で回すことだ。 そのために必要なのが、技術的ハードルが低く、変更を即座にテスト・デプロイでき、かつ本番環境で実運用に耐えるツールだ。この条件を満たすのが、ノーコード・ローコードのAIエージェント開発ツールだと考える。 現場が選ぶ2つの選択肢 ! 明確にしておきたいポイントとして、AI実装の選択肢は多様であり、Python...

RAGの精度向上手法、がっつりまとめ【2025年】

この記事は何 ナレッジセンスでは、エンタープライズ向けにRAGサービスを提供しています。その中で「RAGは簡単に作れるけど、精度を上げるのは難しい」という課題に日々向き合っています。本記事は、2024~2025年に公開された研究や事例をもとに、RAGの回答精度を高める代表的なアプローチを ざっくりまとめたものです。 ざっくりサマリー この記事では、企業の社内データを利用したRAG、特に大企業で「エンタープライズRAG」での実装手法についてざっくり理解します。まず、エンタープライズRAGでのよくある課題をお伝えします。その上で、2025年現在の最新動向を踏まえ、評価手法のような基本... Source link

OpenAI DevDay 2025 発表まとめ

! この記事は人力で書きました。 tl;dr OpenAI DevDay 2025 がサンフランシスコで開催されたよ サンフランシスコ現地から情報をお送りするよ ChatGPT 上で使える Apps SDK が公開されたよ(収益化の話も) AI Agent ワークフローを構築するための AgentKit が公開されたよ 合わせてノーコードライクに操作できる Agent Builder も公開されたよ Codex が正式リリース、Slack から使えるようになったよ 動画生成の Sora 2 の API が公開されたよ だいたい書いたけど、DevDay...

Sora 2 API を触ってみた

OpenAI DevDay 2025 で Sora2 の API が公開されたので公式ドキュメントを参考に試してみました。 ! 本記事は 2025年10月7日時点の情報で書かれています。 https://platform.openai.com/docs/guides/video-generation 概要 Sora2 は 2025年10月現在 OpenAI の最新の動画生成モデルです。Sora2 を使うための Video API では、Sora 2 (id=sora-2) と Sora 2...

OpenAI DevDay 2025の現地レポート【OPENING KEYNOTE編】

はじめまして、ますみです! 株式会社Galirage(ガリレージ)という「生成AIに特化して、システム開発・アドバイザリー支援・研修支援をしているIT企業」で、代表をしております^^ ChatGPTに「Apps inside ChatGPT」が登場し、FigmaやSpotifyなど外部アプリを直接操作できるようなアプリケーション化するための機能が発表されました。 開発者向け「Apps SDK(プレビュー版)」が公開され、データ連携・アクショントリガー・UI統合が可能になりました。 「Agent Kit」により、ノーコードでAIエージェントを構築・配布・最適化できるようになりました。 「Agent Builder」「ChatKit」「Evals」が提供され、企業は自社業務に特化したAIエージェントを容易に実装できます(Copilot Studioのようなもの)。 コード生成AI「Codex」が正式リリース(GA)され、Slack連携・SDK公開・企業向け制御機能が追加されました。 新APIとして「GPT-5 Pro」「Sora 2」「realtime-mini」が発表され、高知能化・動画生成強化・低コスト化などを実現しました。 Sam Altman氏は「これからはアイデアがすべて。AIはすべての人の力になる」と締めくくりました。 2025年10月6日、OpenAI DevDay 2025がサンフランシスコのFort Masonで開催されました 🎉 本記事では、実際に現地レポートとして、開催されたOpenAI DevDay 2025のOpening Keynoteをご紹介します。 ! 【関連記事】昨年のOpenAI DevDay 2024は、弊社CROの越原さんが参加してきました!その際のレポートもぜひご興味あれば、ご覧ください^^ https://zenn.dev/galirage/articles/openai-dev-day-2024 当時のハイライトはこちら👇 Realtime API:リアルタイムSpeech-to-Speech Prompt Caching:コスト削減機能 Model Distillation:モデルの蒸留 Vision Fine-tuning:ビジョンモデルのファインチューニング OpenAI...

CodeXとClaude Code、「今のところ」どっちがストレスなくタスクを頼める?

最近、AIのアウトプット。ストレス溜まってないかい? 最近、Claude Codeが頭悪いって言われてたり、Codexが良くなってきたという話を聞きます。 ただ、比較してみたという記事を見ても、抽象的な内容が多いです。 パフォーマンスとか品質とか、そういうのを見たいんじゃなくて、 出てくるアウトプットが、どれだけ 「俺様をイラつかせない程度には作ってきてくれるのか?」 という方がみなさんも気になるのではないでしょうか?笑 実際どういった指示を出して、そこまでのアプリが出てるかっていうことが 他の記事だと分かりにくかったので、それなら面倒だけど自分が人柱になろう。 ということで、自分の... Source link

Claude Code入門 – AI駆動開発の基礎を1日で身につけよう

AI駆動開発フリーランスエンジニア|プログラミング未経験→ 5年で月収120万円達成 | カナダ在住 | Udemyベストセラー講師|個人開発者 Learning Next 運営 | Claude Code / Codex | バイブコーディング Youtube 運営 Source link

go testのキャッシュの仕組みを理解して、テストコードを変えずにCIを高速化する

サマリ go testは、パッケージごとにテスト結果をキャッシュしている ソースコードに加え、テストコマンドの引数やテスト内で参照したファイルや環境変数がすべて同じなら、キャッシュが利用される そのため、基本的にはCI上でもGoのキャッシュ機構を使用しても問題ない Goが検知できない変更(設定ファイルやデプロイ設定の変更など)がある場合は、キャッシュをクリアすることで偽陰性を回避する必要がある はじめに 普段の開発でGoを使用しているのですが、CIでのテスト実行時間に課題感を感じていました。 テストを高速化したいと思ったのですが、テストコード自体を改善するには結構大きな変更が... Source link

【TypeScript】カスタムエラーのすすめ

TypeScriptで開発をしていると、APIエラーやバリデーションエラーなど、さまざまなエラーを扱う場面があります。 そんなときに、標準のErrorクラスだけで対応していませんか。 この記事では、カスタムエラーを導入するメリットと、ボイラープレートを減らしてカスタムエラーを楽に定義出来るライブラリを紹介します。 カスタムエラーを作る理由 標準のErrorクラスを使用することで楽にエラーを作成できますが、次のような問題があります。 エラーの種類を区別しづらい 追加の情報(HTTPステータスやエラーコードなど)を持たせづらい メッセージが一貫しない たとえば次のような例を考えてみま... Source link

全プロセスが一秒止まる不具合続編: カーネル内部で何が起きたか?

はじめに 完全自動運転の実現を目指すスタートアップ「チューリング」でエンジニアをしています、鈴木勝博です。私が所属しているDrivingSystemチームでは、自動運転向けのシステム開発を担当しています。 Linuxを用いたシステム開発を行っていると、カーネルの挙動、周辺デバイスとの組み合わせ等によって、思いがけない問題に遭遇することが少なくありません。この記事では、実際にシステム開発中に遭遇した「再現が難しく、原因の切り分けに時間を要した問題」について深堀りしてご紹介します。 概要編はこちらのテックブログにてご紹介しています。 https://zenn.dev/turing_mot... Source link

テスト可能な dotfiles 管理:chezmoi で実現する開発環境構築

本記事では、筆者の dotfiles リポジトリ shunk031/dotfiles を題材に、テスト可能性を重視した dotfiles 管理のアプローチについて解説します。 https://github.com/shunk031/dotfiles はじめに dotfiles と dotfiles リポジトリ dotfiles とは、.bashrc、.vimrc、.gitconfig などの「.」で始まる設定ファイル群のことです。近年、これらを Git リポジトリで管理する dotfiles リポジトリ が開発者の間で広く普及しています。 https://awesomeopensource.com/projects/dotfiles https://qiita.com/yutkat/items/c6c7584d9795799ee164 dotfiles リポジトリは単なる設定ファイルの管理ではなく、設定ファイル、インストールやセットアップ用のスクリプトを含む開発環境構築の自動化ツールとして機能することが多いです。これにより、新しいマシンや環境でのセットアップが迅速かつ一貫して行えるようになります。 テストされないスクリプトの問題 ほとんどの dotfiles リポジトリに含まれるセットアップスクリプトやインストールスクリプトは、正しく動作するかテストされていません(つらい)。そのため、新しい環境でセットアップを実行すると様々な問題の発生可能性があります。スクリプトのエラー、依存関係の問題による一部ツールのインストール失敗、OS...

【28分爆速開発】圧勝したのはどっち? 最新AI Claude Sonnet 4.5 vs 4.0 ハッカソン対決!

Claude Sonnet 4.5は、Anthropicが2025年9月30日にリリースした最新のAIモデルです。公式発表によると、「世界最高のコーディングモデル」「複雑なエージェント構築に最も強力なモデル」として位置づけられています。AWSのAmazon Bedrockでも利用可能となっています。 今回は、AI駆動の開発支援ツールのAmazon Q Developerを用いて、Claude Sonnet 4.5(最新モデル)とClaude Sonnet 4.0(Amazon Q Developerで選択できる4.5以外では最新のモデル)の2つに、同じAWS Summit Japan 2025 の生成AIエージェントハッカソン課題を与えて、実際にプロダクト開発対決をさせてみました。 ⚠️ 重要な前提 この記事は1回の試行結果を記録したものです。 AIは同じプロンプトでも毎回異なる出力をします。特に今回のように「自由にテーマを決めて開発する」という課題では、最初のテーマ選択によって開発の方向性が大きく変わります。 今回の結果が両モデルの性能差を示すものではありません 複数回試行すれば異なる結果になる可能性が高いです あくまで「こういうケースもあった」という一例としてお読みください ハッカソンの審査基準 AWS Summit Japan 2025 の生成AIエージェントハッカソンのテーマは、「使いたおして『○○』を実現するAIエージェント爆誕祭」...

クリスのコーナー:不満

少し健全な批判を超えていません。 これがデン・オデルの記事です 私たちはCSSを再発明し続けていますが、スタイリングは決して問題ではありませんでした。 CSSが元々設計されていたものを忘れがちです:ドキュメント。 HTMLを書いて、いくつかの見出しと段落をスタイリングし、左に画像を浮かび、1日と呼ぶかもしれません。その世界では、グローバルなスタイルが理にかなっています。カスケードは役に立ちました。相続はエレガントでした。 数十年前に早送りしており、2000年代初頭に履歴書をスタイリングするための言語を使用して、非常にインタラクティブでコンポーネントベースの国家主導型のデザインシステムが多いアプリケーションを構築しています。 CSSは、カプセル化されたコンポーネント用に構築されていません。動的テーマやランタイムの構成、または水分補給の不一致のために構築されていませんでした。そのため、私たちはそれを機能させるために戦略をボルトで締めて何年も費やしてきました。 私が批評を批評することができれば、それはいくつかの良い鋭いポイントを作りますが、敵が正しくないのでCSSの進化を悩ませます。私の意見では、CSS自体は素晴らしいことをしています。トレンドを追いかけたり、気まぐれな開発者のツーリングトレンドに向かって曲がるのはCSSの仕事ではありません。公平を期すために、デンはまた、それは実際にはCSSのせいではないと言います。それはあなたの目を開けてトレードオフを選択することです。 ジョノ・アルダーソンは満足していません、本当に、現代のWeb開発を完全に備えています。私は彼のイントロのいくつかを引用します: ほとんどのウェブサイトはひどいです。 遅いだけではありません - ひどい。肥大化した、壊れやすい、過剰な設計された災害。彼らはゆっくりとロードし、不規則にレンダリングし、JavaScriptのメガバイトの後ろにコンテンツを隠します。彼らはモバイルでグリッチします。彼らはユーザーをイライラさせ、検索エンジンを混乱させます。維持することは不可能です。そして、どういうわけか、私たちはこれを呼んでいます 進捗。 これは進化ではありません。それは自傷の複雑さです。そして、私たちはそれを正常化しました - 途中でどこかで、私たちはウェブサイトを構築し始めたので 開発者、ためではありません ユーザー。 「モダンな」メディア主導のサイトを見てみると、彼は間違っていないことがわかります。私たちは皆、毎日それを見ています。誰もがウェブサイトがそうであることを知っているので、あなたがウェブサイトを作る人々に伝えるのは最近ではほとんど恥ずかしいです かなり荒い 最近。 私が再び批判を批評することができれば、それは誰も(あなた、私、ヨノ)ということです 必要 これを行うために。ウェブは私たちにこれを強制していません。 Webは驚くほど後方に互換性があります。あなたが何らかの方法で懐かしいウェブサイトを構築する方法でノスタルジックであるならば、それはまだ機能するので、もう一度そのようにそれを始めてください。ヨノはこれに言及していますが、本当の敵に名前を付けるのを逃します。 それを実施するために特に雇います。私はあなたが最新のJavaScriptの貨物cultingでウェブサイトを構築する必要はないと言うことができますが、ウェブ開発でまともな支払いの仕事を得るためには、あなたがそうする必要があるかもしれません。それがここでの本当の残念です。はい、これは問題であり、企業が従業員に小切手を書き始めない限り、それを修正するつもりはありません 取り除く クルフトと 取り除く 複雑さと...

【なぜAIに設計を任せると成長が止まるのか】Kiroを使っても学べない設計スキルの真実

はじめに 僕自身、実務や個人開発でAIを活用して開発しています。Kiroやcc-sddを使った仕様駆動開発を行い、AI を使って生産性は向上している。また余った時間をコードレビューにも使い、コードの質もある程度は担保出来るようになりました。 しかし、ある時ふと感じました。「僕自身の設計スキルは向上してないのでは?」と。 AIに機能要件を伝えれば設計書を作ってくれるし、その段階でレビューすれば設計の質も担保できる。しかし「自分自身は何も成長していない」とも同時に感じていました。 そこで「AIを使いつつ、設計スキルを最大限高めるにはどうしたらいいか?」を自分なりに整理してみました。まずは... Source link

“macOS→Omarchy”の移行ガイド

はじめに 私は Mac がまだ “Macintosh” と呼ばれていたころからずっと Mac を使ってきました。ですがこのたび、思い切って Omarchy(Linux ディストリビューション)に移行しました。1 ヶ月ほど使ってみての感想や気づきを、これから移行する方の参考になればと思い、まとめています。 試してみて「ここ違ったよ」「こうするともっと良かった」などあれば、コメントで教えてもらえると嬉しいです。 私の環境。Asus 32インチ 6Kディスプレイと Omarchy のタイル型ウインドウの相性が良いです。 なぜ Omarchy に移行したのか? 「Macが嫌いになった!... Source link

Rustのパターンマッチってアートだヨネ

こんにちワ! Rust大好きなサーバーサイドエンジニアのnamniumと申します。 Rustのソースコードはしばしばアートのように振る舞います。その中でもRustのパターンマッチは言語を代表する機能だけあって、綺麗に書けた時の美しさといえば筆舌に尽くしがたいです! 今回はそんなRustパターンマッチの世界を皆様に紹介したく無理やり筆を執りました! 次の"アート"に違和感を持った方はぜひ本記事を読んでみてほしいです! let Point { x, y } = p; let c @ 'A'..='Z' = v else { return; }; let () = {}; let ((... Source link

結局フロントエンド実装はAIに何を渡せばいいの? DesignBench論文でわかった画像よりコードが強い理由とその実データ

AIにフロントエンドUIを実装させるとき、 あなたは何を渡しているだろう?──Figmaの画像か、それともコードか。 2025年の論文 DesignBench (arXiv:2506.06251) は、 この疑問に対して「コードの方が明確に優れている」と、実験データで結論を出した。 🧩 DesignBenchとは DesignBenchは、React/Vue/Angularなどの主要フレームワークで動作する 実際のコンポーネント単位コードを対象に、以下3タスクでAIを評価するベンチマーク。 タスク 内容 目的 Generation 指示やデザインから新規UIを生成 コ... Source link

「ゆっくり実況」みたいな動画をAWSサービスを駆使して作ってみる

はじめに ゆっくり実況やVOICEBOXの製品を利用した解説動画ってよく見かけますよね。 ああいったタイプの、いわゆる「バーチャルキャラクターによる解説動画」ってのがあると思うんですが、この前見ていてふと思ったんですよね、「Amazon PollyとAmazon Bedrockを使えば私でも作れるんじゃないか…?」って。 台本やキャラクターの絵はBedrockでいけるし、読み上げる音声はPollyでいけるんじゃないか?と。 よし、やってみよう! 先に結果 できあがった動画をご覧になりたい方は、こちらのYouTubeをどうぞ。 https://youtu.be/Ka-3MrIaX9... Source link

読書を資産化するプロセスの見直し備忘録

読書を散漫としている感じがする。 ハイライトをして読んで満足しているだけ。 本に引いたハイライトを日々のタスクや、アウトプットに有効活用できていない。 といった課題感があり、読書の「資産化のプロセスの見直し」と捉え、情報の分類・蓄積・再利用の流れを根本から見直すことにしたときの備忘録。 見直しには以下の書籍を参考にしている。 https://www.amazon.co.jp/dp/4296000411 https://www.amazon.co.jp/dp/4297137194 ! 「読んだ内容が散逸しがちなので、 Zettelkasten をヒントにしつつ、自分なりの資産化プロセス... Source link

Views: 0