logo
Search

LLM

ハーネスエンジニアリングとは何か:プロンプト→コンテキスト→ハーネスへ至るAIエージェント設計の変遷

Apr 7th 2026

ハーネスエンジニアリングとは何か:プロンプト→コンテキスト→ハーネスへ至るAIエージェント設計の変遷

「ハーネスエンジニアリング」とは何か。プロンプトエンジニアリング、コンテキストエンジニアリングから続く3段階の変遷を、論文引用(Lost in the Middle / SWE-bench)とClaude Codeの実装例(フック・ルール・Skill)で階層構造として整理する。

#Prompt Engineering#Harness Engineering#Context Engineering#LLM
RAG入門 — 検索拡張生成の基礎知識を実験結果とともに学ぶ

Mar 1st 2026

RAG入門 — 検索拡張生成の基礎知識を実験結果とともに学ぶ

RAG(検索拡張生成)の仕組みをVectorDB・Embedding・チャンク分割の3要素に分解して解説。Embeddingモデル変更で正答率0/5→4/5に改善した検証データも公開。

#RAG#LLM#ollama
1人のエンジニアがAIを日常にどう組み込んでいるか — 契約サービスから活用フローまで全公開

Feb 18th 2026

1人のエンジニアがAIを日常にどう組み込んでいるか — 契約サービスから活用フローまで全公開

Claude Code、ChatGPT、Gemini、Aqua Voice、Adobe Fireflyの5サービスを使い分けるエンジニアが、開発・情報収集・ブレスト・音声入力・振り返りまで、AIを日常に組み込んだリアルな活用フローを全公開します。

#LLM#openclaw#マルチエージェント
Claude Codeマルチエージェント実践|AI Orchestraで超えた2つの壁

Feb 8th 2026

Claude Codeマルチエージェント実践|AI Orchestraで超えた2つの壁

Claude Code単体運用で生じるコンテキスト溢れ・役割混乱の課題を、25種の専門エージェントとClaude×Codex×Geminiのマルチモデル連携で解決するオーケストレーションシステム「AI Orchestra」。その設計思想、Hookによる自動ルーティング、並列レビューなどの実装を具体的に紹介します。

#マルチエージェント#LLM
AIベンチマーク読み方ガイド|SWE-bench・GPQA・ARC-AGIの意味と活用法

Feb 7th 2026

AIベンチマーク読み方ガイド|SWE-bench・GPQA・ARC-AGIの意味と活用法

SWE-bench、GPQA Diamond、ARC-AGI、Terminal-Benchなど主要AIベンチマークの読み方を解説。2026年2月最新のモデルスコア比較と、コーディングエージェントへのタスク振り分けに活かす実践的な指針を紹介します。

#LLM#Benchmark
マルチエージェント構築入門|構成の全体像と3つの実装アプローチ

Feb 5th 2026

マルチエージェント構築入門|構成の全体像と3つの実装アプローチ

マルチエージェントの構築方法を解説。オーケストレーター・サブエージェント・ツール連携の3要素から、自作・フレームワーク・既存ツール活用の選択肢まで。Claude Codeでの実装例付き。

#LLM#マルチエージェント
ChatGPTやClaudeがもっと賢くなる!カスタム指示の書き方と実例集

Jan 30th 2026

ChatGPTやClaudeがもっと賢くなる!カスタム指示の書き方と実例集

「ChatGPTの回答が長すぎる」「毎回同じことを説明するのが面倒」「もっと専門的に答えてほしい」 こんな悩みを持っ...

#LLM#Prompt Engineering
ローカルLLMはまず小さめモデルから:Ollamaで始める導入〜疎通確認

Jan 18th 2026

ローカルLLMはまず小さめモデルから:Ollamaで始める導入〜疎通確認

acでOllamaを使い、ローカルLLMを最短で起動→1回応答まで確認する手順を解説。モデル選定の考え方、遅い/メモリ/ディスクの切り分け、API疎通(curl)もまとめます。

#ollama#LLM
1

Categories

Tags

#Next.js #jwt #auth.js #Prompt Engineering #Harness Engineering #Context Engineering #開発環境 #lazygit #git-worktree-runner #git-worktree #git #RAG #claude code #takt #マルチエージェント #openclaw #LLM #ollama #Benchmark #Vite #Nuxt.js #Docker #Django REST Framework #React #Notion