カテゴリ

ヘルプ・ご質問

BOOKOFF公式サイト店舗検索買取はこちら

1,800円以上の注文で送料無料

トップ
書籍
情報・通信・コンピュータ
コンピュータ・情報処理
人工知能
生成AIのしくみ〈流れ〉が画像・音声・動画をつくる

書籍
書籍
1211-03-01

生成AIのしくみ〈流れ〉が画像・音声・動画をつくる岩波科学ライブラリー328

岡野原大輔(著者)

18件

追加するに追加する

中古新品

1,650円

獲得ポイント15P

カートに追加

在庫あり

発送時期 1～5日以内に発送

返品について

商品詳細

内容紹介
販売会社／発売会社	岩波書店
発売年月日	2024/12/01 改訂版・発行年月日について
JAN	9784000297288

生成AIのしくみ

¥1,650

在庫あり

カートに追加するカートにいれる

商品レビュー

3.6

18件のお客様レビュー

レビューを投稿

2026/06/25

【学内から】 https://kinoden.kinokuniya.co.jp/kyorinlib/bookdetail/p/KP00133541 【学外からリモートアクセス】 https://sfx3.usaco.co.jp/kul?url_ver=Z39.88-2004&a...

表示する

【学内から】 https://kinoden.kinokuniya.co.jp/kyorinlib/bookdetail/p/KP00133541 【学外からリモートアクセス】 https://sfx3.usaco.co.jp/kul?url_ver=Z39.88-2004&url_ctx_fmt=infofi/fmt:kev:mtx:ctx&ctx_enc=info:ofi/enc:UTF-8&ctx_ver=Z39.88-2004&rfr_id=info:sid/sfxit.com:azbook&sfx.ignore_date_threshold=1&rft.object_id=46147349300041

Posted by ブクログ

2026/05/31

「水面に書いたインク文字が広がっていく過程を逆向きに再生できれば文字が浮かび上がる――〈流れ〉が生成AIの核心となるアイデアだ。」なるほど、なんとなくイメージできたでもって本書はこのことをもうちょっと専門的に解説してくれるなかなかムズいなんかこう分かったような分から...

表示する

「水面に書いたインク文字が広がっていく過程を逆向きに再生できれば文字が浮かび上がる――〈流れ〉が生成AIの核心となるアイデアだ。」なるほど、なんとなくイメージできたでもって本書はこのことをもうちょっと専門的に解説してくれるなかなかムズいなんかこう分かったような分からんかったような…まぁ、こういう時はだいたい分かってないそして分かったからといって役に立つような役に立たないようなだがしかーし！役に立つ立たないはこの際全く関係ない知的好奇心ってそういうことだからなそれにしても生成AIよこれからどうなって行くんだろうね気になるのは「シンギュラリティ」よ 2045年と言われてきたが、なんとなくもっと早く到達しそうな感じね不安でもあり楽しみでもあり人類とAIの関係ってどうなって行くんだろうねとりあえずなんかこう優しくしてください！(*´ω｀*)

Posted by ブクログ

2026/05/11

エネルギーモデル各要素について、学習データにより確率を学習し、多次元空間上でよりエネルギーの低い安定した状態にボールが転がるように確率の高い方へ推論することでデータを推測。各要素について学習した確率の総和が1となるよう補正する必要があり、全要素の確率を出さないといけないため計算...

表示する

エネルギーモデル各要素について、学習データにより確率を学習し、多次元空間上でよりエネルギーの低い安定した状態にボールが転がるように確率の高い方へ推論することでデータを推測。各要素について学習した確率の総和が1となるよう補正する必要があり、全要素の確率を出さないといけないため計算量が膨大すぎる正規化モデル予め設定した確率分布に、学習する度に補正を加え、補正時は全体の総和が変わらないように周辺を補正していくモデル。これでも計算量が膨大であることと、学習データに過度に適応した複雑な流れができてしまうことがネック拡散モデル学習データにノイズを加えていき最終的にランダムなデータにまで移行していく際のノイズの加わる流れを学習し、これを反転させることでデータを生成するもの。段階・位置ごとに流れを学習できるため効率的。フロー・マッチング段階を踏まずに学習データの各点からランダムデータの各点までの直線を学習し、一気に生成するモデル。全要素を学習しようとすると計算量が膨大であるため、サンプリングした点で学習し、それらを束ねた流れでデータ生成を行う。拡散モデルによって汎化が達成され未知のデータも生成できるようになった。汎化の仕組みが解明されれば創造性とハルシネーションの抑止をコントロールできるようになるとのこと。また、言語モデルでも拡散モデルが使えるようになれば（現状は言語データが離散的であるためうまく機能せず）、多様な推測が可能となりより複雑な推論できるようになることや、逐次処理ではなく全要素を並列で処理できるようになることによる効率化期待されるとのこと。 ※■ 2026年5月時点の補正・最新アップデート 1. エネルギー／正規化モデルの現状** 補正：「計算量の膨大さ」という課題は、確率の総和を計算せず、密度の勾配（スコア）のみを追う「スコアベースモデル」への移行によって実用レベルで解決済み。エネルギーモデルの柔軟性を保ちつつ、効率的な学習が可能になっている。 2. 拡散モデルの高速化変化：かつては「生成に時間がかかる」のが弱点だったが、「蒸留（Distillation）」技術の進化により、現在では1〜数ステップで高品質なデータを生成可能。かつての「段階を踏むため遅い」という認識は過去のものとなった。 3. フロー・マッチングの主流化変化：2024年当時は次世代技術だったが、現在は動画生成や音声生成のデファクトスタンダード（標準技術）に昇格。拡散モデルの複雑な軌道を「直線化（Rectified Flow）」することで、計算効率と精度の両立が達成されている。 4. 言語モデルにおける「離散データの壁」の突破補正：離散的な言語データを直接扱うのではなく、「連続的な潜在空間（埋め込み空間）」上で拡散やフローを行う手法が確立。進化：これにより、従来の「一文字ずつ順番に出力する（逐次処理）」だけでなく、テキスト全体を並列で一気に生成する「非自己回帰型生成」が実用化。生成速度が劇的に向上し、より複雑な論理構造の保持が可能になった。 5. 汎化と制御（創造性とハルシネーション）状況：汎化の仕組みの解明が進み、フロー（流れ）の軌道を意図的に外らすことで「創造性」を、軌道の確信度を測定することで「ハルシネーションの検知・抑制」を、動的にコントロールする技術が実装され始めている。 6. 総括：統一理論への移行最新知見：画像、言語、動画などのメディア種別を問わず、すべてを多次元空間上の「流れ」として制御する「ユニバーサル・フロー・アーキテクチャ」へと技術が統合されており、モデル間の境界線は消失しつつある。

Posted by ブクログ

すべてのレビューを見る

生成AIのしくみ〈流れ〉が画像・音声・動画をつくる岩波科学ライブラリー328

商品詳細

商品レビュー

関連ワードから探す

関連商品

同じジャンルのおすすめ商品

最近チェックした商品

生成AIのしくみ 〈流れ〉が画像・音声・動画をつくる 岩波科学ライブラリー328

商品詳細

商品レビュー

関連ワードから探す

関連商品

同じジャンルのおすすめ商品

最近チェックした商品

生成AIのしくみ〈流れ〉が画像・音声・動画をつくる岩波科学ライブラリー328