株式会社ずんだもん技術室AI放送局

By: 株式会社ずんだもん技術室AI放送局
  • Summary

  • AIやテクノロジーのトレンドを届けるPodcast。平日毎朝6時配信。朝の通勤時間や支度中に情報キャッチアップとして聞いてほしいのだ。
    Show More Show Less
activate_Holiday_promo_in_buybox_DT_T2
Episodes
  • 株式会社ずんだもん技術室AI放送局 podcast 20241227
    Dec 26 2024
    関連リンク
    • Claudeが提案するエージェント構築:簡単で効果的な設計のベストプラクティス|Kyutaro

    この記事では、AI「Claude」を基に、エージェント構築の効果的な設計パターンを解説しています。エージェントとは、自律的にタスクを計画・実行するAIシステムのことです。ワークフロー(事前に決められた手順)に対し、エージェントは柔軟にタスクを解釈し、自ら判断して手順やツールを使い分けます。

    エージェントは、複雑で柔軟な対応が求められるタスクや、リアルタイムな判断が必要な場合に有効です。ただし、コストがかかり、誤った判断をするリスクもあるため、テスト環境での検証が重要です。

    エージェント構築の基本パターンとして、プロンプト・チェイニング、ルーティング、並列化、オーケストレーター・ワーカー、評価者・最適化ループの5つが紹介されています。高度なエージェントは、柔軟なタスク処理能力、環境からのフィードバック活用、自己修復とエラー復旧、ツール活用といった特徴を持ち、カスタマーサポートやソフトウェア開発支援などでの活用が期待されます。

    エージェント構築を成功させるには、シンプルな設計、透明性の確保、ツール設計への注力、テスト環境での十分な検証が不可欠です。特に、ツール設計はエージェントの外部環境とのインターフェースとして重要であり、テストと評価を繰り返すことで、実運用での性能を最大限に引き出せます。

    引用元: https://note.com/kyutaro15/n/ne88fe2fcf928

    • 【2024年版】エンジニア必見 生産性があがるチートシート集

    この記事は、エンジニア向けの様々なチートシートを集めたものです。生成AI、機械学習、プログラミング言語(Python, JavaScript, Ruby, PHP, TypeScript, Java, C#, Swift, Go, C++)、フレームワーク・ライブラリ(Nuxt, Rails, SpringBoot, React, Laravel, Vue.js, Flutter, Next.js, Jupyter Lab)、マークアップ・スタイリング(HTML, CSS, Sass, Markdown)、開発ツール(VSCode, Git, Docker, Kubernetes, AWS, Google Cloud, Azure)、データベース(SQL, MongoDB)、CMS(WordPress)、その他(正規表現、命名規則、シェルスクリプト、ターミナルコマンド)と幅広い分野を網羅しています。特に、生成AIのプロンプトエンジニアリングやLangChain、各プログラミング言語の基本構文、主要なフレームワークの使い方、開発ツールのコマンドなどが、実務で役立つようにまとめられています。新人エンジニアが日々の業務で参照し、効率的に開発を進める上で非常に役立つでしょう。

    引用元: https://qiita.com/qrrq/items/51f6f0944c82f5cb3d16

    • 【独自】政府、「AI推進法案」を来年の通常国会に提出へ 偽情報は“罰則なし” TBS NEWS DIG

    政府は、AIの利用を促進するための「AI推進法案」を来年の通常国会に提出する方針を決定しました。この法案では、AIによって生成された偽情報に対する罰則は設けられない見込みです。政府は、AI技術の発展を支援しつつ、その利用に伴うリスクについても検討を進めています。

    引用元: https://newsdig.tbs.co.jp/articles/-/1637149

    • お便り投稿フォーム

    (株式会社ずんだもんは架空の登場組織です)

    Show More Show Less
    Less than 1 minute
  • 株式会社ずんだもん技術室AI放送局 podcast 20241226
    Dec 25 2024
    関連リンク 2024年生成AIエージェントのおすすめ論文 16選 この記事は、AIエージェント研究に一年を費やした筆者が、2024年に発表されたAIエージェント関連の論文の中から、特にビジネスやエンジニア層にとって学びが多いと思われる16本を厳選して紹介しています。論文は、AIエージェントの基礎から応用、評価方法、具体的な構築のポイント、マルチエージェント、人間とのインタラクション、学習方法、そしてメタ認知能力や脱出ゲームへの挑戦といったユニークなテーマまで幅広くカバーしています。各論文の概要とともに、読者が理解を深めるための質問例も提示されており、AIエージェントに関わる技術者にとって、現状を把握し、今後の開発や研究のヒントを得るのに役立つ内容となっています。また、記事の最後に、AIエージェント関連の優れたまとめ記事へのリンクも紹介されており、より深く学びたい読者への配慮もなされています。 引用元: https://masamasa59.hatenablog.com/entry/2024-best-papers-on-ai-agents LLMのモデルマージ手法 データアナリティクスラボ この記事では、LLM(大規模言語モデル)のモデルマージ技術について解説しています。モデルマージとは、複数のモデルのパラメータを組み合わせて新しいモデルを作る技術で、計算コストを抑えつつ高性能なモデルを効率的に構築できる可能性があります。 モデルマージの種類 パラメータ空間でのマージ:モデルの各層のパラメータの重みを統合するデータフロー空間でのマージ:複数のモデルの層を組み替えて新しいモデルを作る この記事では、パラメータ空間でのマージに焦点を当てています。 モデルマージの効果 モデルスープ:複数の微調整モデルの重みを平均化することで、精度とロバスト性を向上させることができる。モデルの重みを平均化することで、損失関数の「平坦解」に近づき、汎化性能が向上する可能性がある。 モデルマージの具体的な手法 Task Arithmetic:微調整後のモデルの重みから微調整前の重みを引いてタスクベクトルを作成し、それらを足し引きすることでタスク能力を付与する。TIES:デルタパラメータ(タスクベクトルと同義)の枝刈り(重要度の低いパラメータを削除)と、優位な符号に一致する重みをマージすることでパラメータ干渉を抑制する。DARE:デルタパラメータをランダムに枝刈りし、リスケーリングすることで精度を維持する。Model Breadcrumbs:デルタパラメータの絶対値の上下を閾値として枝刈りし、外れ値を除去する。TALL Mask:タスク間の干渉を考慮し、タスクに重要な重みを残すようにマスクする。DELLA:デルタパラメータの重みの大きさに応じてドロップする確率を設定し、枝刈りを行う。MetaGPT:モデルマージ後の損失と各モデルの損失の差を最小化するように、最適な按分を求める。KnOTS:LoRAで微調整したモデルのマージに特化し、SVD(特異値分解)を用いて共通の基底を抽出し、マージの精度を向上させる。 その他 進化的モデルマージ:進化アルゴリズムを用いてマージのハイパーパラメータを最適化する。MoE Merging:複数のモデルをエキスパートとしてMoE(Mixture of Experts)モデルを構築する。 実装方法 mergekit:様々なマージ手法をサポートするライブラリ。進化的モデルマージの実装例は、記事内で紹介されているリンクを参照。 モデルマージは、ドメイン特化LLMの構築において、コストを抑えつつ高性能なモデルを作るための有効な手段となる可能性があります。 引用元: https://dalab.jp/archives/journal/llm-merge-techniques/ Devin AIにテストを丸ごと書かかせてCIがパスするまで作業してもらう方法 Devinは、ソフトウェア開発を効率化するAIプラットフォームで、特にテストコードの自動生成に優れています。Slackでテスト作成を依頼すると、Devinは指定されたリポジトリにアクセスし、既存のテスト事例を参考にテストコードを生成、GitHubにPRを作成します。CIが失敗した場合は、自動で修正を試みます。さらに、SlackやGitHubのPRコメント、DevinのUIから追加の作業依頼も可能です。Devinは過去のフィードバックを学習し、リポジトリごとに「Knowledge」として保存するため、継続的に...
    Show More Show Less
    Less than 1 minute
  • 株式会社ずんだもん技術室AI放送局 podcast 20241225
    Dec 24 2024
    関連リンク GitHub - browser-use/browser-use: Make websites accessible for AI agents このリポジトリは、AIエージェントがウェブサイトにアクセスしやすくするためのツール「browser-use」を提供します。主な機能は、ウェブサイトのコンテンツ抽出、複数タブの自動管理、クリックした要素のXPath抽出、カスタムアクションの追加、自己修正機能などです。LangChainをサポートする様々なLLM(例:gpt4o, claude 3.5 sonnet)に対応し、複数のエージェントを並列実行できます。カスタムアクションは、同期・非同期関数で定義可能で、Pydanticモデルによるパラメータ定義も可能です。ブラウザ設定はBrowserConfigとBrowserContextConfigクラスでカスタマイズでき、headlessモードの切り替え、ブラウザのセキュリティ設定、Cookieファイルの指定などが可能です。 引用元: https://github.com/browser-use/browser-use 完全にオープンな約1,720億パラメータ(GPT-3級)の大規模言語モデル 「llm-jp-3-172b-instruct3」を一般公開~GPT-3.5を超える性能を達成~ - 国立情報学研究所 / National Institute of Informatics 国立情報学研究所が、GPT-3と同規模の約1,720億パラメータを持つ大規模言語モデル「llm-jp-3-172b-instruct3」を公開しました。このモデルは、2.1兆トークンという大量の学習データで訓練され、日本語の理解能力を測るベンチマークでGPT-3.5を超える性能を達成しています。特筆すべきは、学習データを含めて全てオープンにされている点で、これは世界最大規模です。開発には、経済産業省・NEDOのプロジェクトや文部科学省の補助金が活用されました。モデルのアーキテクチャはLlama 2ベースで、日本語と英語のインストラクションデータでチューニングされています。今後の展開として、モデルの透明性と信頼性確保に向けた研究開発を進め、他のチェックポイントデータも公開予定です。このモデルは、LLMの研究開発を促進し、社会での利活用に貢献することが期待されています。 引用元: https://www.nii.ac.jp/news/release/2024/1224.html vLLMを利用したLLM推論高速化テクニック この記事では、LLM(大規模言語モデル)の推論を高速化するためのライブラリvLLMについて解説しています。vLLMは、Paged Attentionという技術でAttention計算を効率化し、推論を高速化します。また、Hugging Faceの主要モデルをサポートしており、カスタム実装なしで利用可能です。さらに、GPUリソース管理やCPUオフロード機能も備えています。 記事では、vLLMを使わない場合と使用した場合の推論速度を比較しています。Hugging Faceを使った場合、Qwen2.5-7Bモデルでの推論に92時間かかるところ、vLLMを使用すると281秒に短縮されました。また、vLLMに加えてAWQ(量子化技術)を利用すると、GPUメモリを削減できますが、推論時間は360秒と若干遅くなります。 さらに、Auto Prefix Cachingという機能を使うことで、プロンプトの共通部分の計算を使い回し、推論を高速化できることも紹介しています。One-Shot Sampleを先頭に加えた場合、この機能により推論時間が296秒から189秒に短縮されました。 最後に、GPUメモリが不足する場合に、CPUオフロード機能を使うことで、大規模モデルの推論も可能になることを説明しています。ただし、CPUオフロードを利用すると、推論時間はGPUのみの場合と比較して大幅に増加します。 vLLMは、LLMの推論を高速化するための様々な機能を提供しており、LLMを効率的に利用するために役立つツールです。 引用元: https://acro-engineer.hatenablog.com/entry/2024/12/24/120000 AI decodes the calls of the wild AI技術を用いて動物のコミュニケーションを解読する研究が進んでいます。具体的には、クジラ、ゾウ、サルなどの鳴き声や音のパターンをAIで解析し、彼らが互いに何を伝え合っているのかを理解しようとしています。 例えば、マッコウクジラはクリック音の連続(コーダ)でコミュニケーションを取り、地域によって異なる方言を持つことがわかっています。AIは、これらのコーダのテンポやリズムの微妙な変化(ルバートや装飾音)を検出し、クジラが複雑な情報を共有するための「音素アルファベット」のようなものを持っている可能性を示唆しています。 また、アフリカゾウは個体ごとに異なる鳴き声...
    Show More Show Less
    Less than 1 minute

What listeners say about 株式会社ずんだもん技術室AI放送局

Average customer ratings

Reviews - Please select the tabs below to change the source of reviews.