サクサク読めて、アプリ限定の機能も多数!
トップへ戻る
ブラックフライデー
www.techno-edge.net
では、SunoとWMG、UdioとUMGの提携はどこが共通して、どこが違うのでしょうか。 どちらも以前の著作権侵害訴訟を和解させる画期的な動きであるという共通点がありますが、プラットフォームの移行期間や既存ユーザーへの対応とエコシステムの拡大戦略において違いがあります。 ユーザーにとって大きいのは、現行サービスが維持されるかどうかですが、この点においてはUdioは新サービスへの移行期間中はダウンロードができなくなっているという、既存利用者にとって致命的な状況ですが、Sunoは、有償プラン限定ではありますが、そのまま使えます。 Sunoの無料プランでは再生と共有のみが可能。有料プランはダウンロードは可能ですが、毎月のダウンロード数には上限が課せられます。上限については後ほど発表される予定。Sunoユーザーも無傷ではいられなかったようです。 ▲Sunoの無料アカウントでは生成した楽曲がダウンロ
生成AIグラビアをグラビアカメラマンが作るとどうなる? 連載記事一覧 本連載では新しいCheckpointやLoRA、ComfyUIのカスタムノードなど、ローカル生成をメインで扱っているのだが、2025年夏の陣も終わり今は一段落している。そこで今回はサービス系で筆者が最近使っているものをご紹介したい。 Google Mixboard11月11日、GoogleからいきなりリリースされたのがMixboard。txt2img、img2imgに対応し、裏では多分Nano Bananaが動いている。つまり画像生成ができて編集も可能。 Mixboardトップ画面これだけなら既にローカルでもQwen-Image-Edit-2509があるのでたいして驚かないのだが、注目はそのUI! まずtxt2imgでPromptに適当なキーワードや日本語英語に関わらず文章を入れると(ここでは”秋、紅葉、秋服を着た可愛い
2014年から先端テクノロジーの研究を論文単位で記事にして紹介しているWebメディアのSeamless(シームレス)を運営し、執筆しています。 1週間の気になる生成AI技術・研究をいくつかピックアップして解説する連載「生成AIウィークリー」から、特に興味深いAI技術や研究にスポットライトを当てる生成AIクローズアップ。 今回は、Googleが発表した画像生成および編集モデル「Nano Banana Pro」(Gemini 3.0 Pro Image)を取り上げます。 度肝を抜くような生成結果が出力されるAIモデルが登場すると、界隈の人たちがこぞって試し、Xで成果物を共有する現象が起きます。以前にも、OpenAI「o3-mini-high」が登場した時には、軽量で低料金、コード生成が強いという理由で、プロンプトから一発出しでゲームを生成する共有祭りが始まりました。 関連記事:OpenAI「o
ソニーがPlayStation Storeでブラックフライデーセールを実施中です。 ゲームや追加コンテンツ等が最大80%オフになる大型セールですが、サブスクリプションのPlayStation Plus最上位プラン『PS Plus プレミアム』も新規加入で55%オフ。 通常は12か月で1万3900円のところ、セール価格では約7600円安い6255円。月にして約522円と、最小プランのエッセンシャル(12か月6800円)よりもお得になっています。 セールは12月5日まで。ですが、毎年割引価格を継続する可能性を高めるには、期間中のできるだけ早い日に加入することが重要です。 PS Plusサブスクのセールは原則「新規加入」「アップグレード」のみ。プレミアム継続は対象外理由は上の小見出しのとおり。セールは新規加入者だけが対象で、すでにPS Plusプレミアムに加入している場合、継続はセール対象になり
ガジェット全般、サイエンス、宇宙、音楽、モータースポーツetc... 電気・ネットワーク技術者。実績媒体Engadget日本版, Autoblog日本版, Forbes JAPAN他 Anthropicは、最新のAIモデルとなるClaude Opus 4.5を発表しました。同社の説明によれば、コーディングやコンピューターの操作、複雑な業務タスクでのユーザー支援に長けた「世界最高峰のモデル」とのことです。 AnthropicのClaude AIモデルには、高速でコスト効率が高く簡易なタスクに向くHaiku、ビジネス用途にも対応する中級向けで重すぎないタスクに向いているSonnet、そして今回発表された、高度な推論能力を持ち、ソフトウェア開発者や、金融アナリスト、コンサルタント、会計士といった知識労働者をターゲットとするフラッグシップモデルであるOpusの3種類があります。 Opusの前バージ
AIが「原神」を56分でクリアする、ゲームAIエージェント「Lumine」をByteDanceが開発ByteDance Seedの研究チームは、3Dオープンワールドゲームで人間レベルのプレイを実現するAIエージェント「Lumine」を発表しました。これは、複雑な3D環境で数時間にわたるミッションをリアルタイムで完了できるAIシステムです。 Lumineは、Qwen2-VL-7Bベースモデルを基盤とし、ゲーム画面のピクセルデータから直接キーボードとマウスの操作を生成します。毎秒5回の頻度で画面を認識し、30Hzの精度でアクションを出力する仕組みです。必要に応じて内部で推論を行い、状況に適応的に対応する機能を備えています。 訓練には約2400時間の人間のゲームプレイデータを使用し、3段階の学習プロセスを経ています。まず1731時間のプレイデータで基本的な操作を学習し、次に200時間の指示追従デ
2022年11月にChatGPTが公開されて以来、生成AIの普及は一気に加速しました。すでに日常的に使っている人もいる一方、「仕事にどう生かせばいいかわからない」「業務に定着しない」といった声もまだ多く聞こえます。 そこでテクノエッジ編集部では、生成AIをビジネス現場でどう活用し、定着させていくのか——その具体的な手法を紹介するセミナー「Gen-Biz(ジェネビズ)」を開催しました。登壇したのは、テクノエッジ編集部の松尾氏、営業支援のセレブリックスの福田氏、AIボイスレコーダーPLAUDの鈴木氏の3名。 本記事では当日の3セッションをまとめて紹介します。 オープニング:生成AIは“特別なツール”から“日常的な作業環境”へ冒頭セッションでは、テクノエッジ編集部の松尾氏が自身のAI活用スタイルを紹介しました。 (左)テクノエッジ編集部 鷹木 創 氏、(右)松尾 公也氏現在はGoogleの「Ge
Googleは、画像生成・編集モデル「Nano Banana Pro(Gemini 3 Pro Image)」を発表しました。「Geminiの最先端の推論技術と実世界の知識を活用し、これまで以上に優れた情報視覚化を実現」するとGoogleは説明しています。 筆者は現在、テレビ番組向けにAI映像を作る仕事(近日公開予定)をなぜかやっており、そこでもNano Banana(そしてPro)は活躍してくれました。 さて、そんなNano Banana Proですが、日本語の描画が的確になったという評判で、漫画を描かせたりしている人も出ています。 なら、日本語手書き文字もいけるのでは? そう思って試してみました。 この試みは、以前もやったことがありましたが、当時できたのはアルファベットだけ。これで自分の事務所の看板を妻の手描き文字風にしてみたのです。事務所の名前はアルファベットなので。 今回は、日本語
ガジェット全般、サイエンス、宇宙、音楽、モータースポーツetc... 電気・ネットワーク技術者。実績媒体Engadget日本版, Autoblog日本版, Forbes JAPAN他 Googleは、画像生成・編集モデル「Nano Banana Pro(Gemini 3 Pro Image)」を発表しました。「Geminiの最先端の推論技術と実世界の知識を活用し、これまで以上に優れた情報視覚化を実現」するとGoogleは説明しています。 Nano Banana Proは今週初めにリリースされたばかりの、推論機能が向上したGemini 3 Proをベースとしており、従来より美しい画像の生成は当然として、与えたコンテンツや「現実世界の事実」に基づく、文脈豊かなインフォグラフィックや図表など、見る者がそれによって何かをより深く理解できるような、「正確な」解説を作成できるとのことです。 また作成す
ガジェット全般、サイエンス、宇宙、音楽、モータースポーツetc... 電気・ネットワーク技術者。実績媒体Engadget日本版, Autoblog日本版, Forbes JAPAN他 Googleは、Androidのデバイス間ファイル転送機能であるQuick Shareが、アップルのAirDropと対応し、相互に転送が可能になったと発表しました。 現状、この機能を使えるのは「Pixel 10以降」に限られます。有効化するにはPixel 10以降の設定アプリ内にあるシステムサービスの設定でQuick Share拡張機能を更新し、さらにシステムを再起動する必要があります。また、相手となるアップルデバイスでも、AirDropを「すべての人(10分間のみ)」に設定しなければならないという制約があります。それでも、Androidとアップルデバイス間で手軽に写真や動画、その他のファイルを転送可能になっ
Hypershell(ハイパーシェル)は腰とヒザ上にベルトで装着して、腿の動きを電動アシストする製品。 歩く・走る・階段昇降・自転車を漕ぐなどの動きを補助することで「脚力40%強化・最大30kg分の荷物負荷相殺・体力消耗30%軽減」と称しています。 Hypershell X Pro外骨格とはHypershell X は、2021年創業のスタートアップHypershell社が開発する電動アシスト外骨格。 Hypershell社はDJIやXiaomiといったエレクトロニクス企業出身者、ロボティクス専門家等を中心に設立した企業で、ハードウェア設計に加えて高度なセンシングやAIなどソフトウェアの統合を売りにしています。 テクノロジーで身体を拡張する『攻殻機動隊』の世界観にインスピレーションを得て開発したと公言する Hypershell X は同社初の製品。下半身、大腿部の動きに絞ってアシストするシ
用途はアウトドアや旅行、写真撮影など重い機材を運ぶ活動、階段昇降や自転車を含む日常の移動など。 いわゆるパワードスーツといえば、重い荷物を持ち上げる作業用や軍用の大掛かりなもの、歩行補助やリハビリ目的の医療用が思い浮かびます。 auが扱いを開始したハイパーシェルはモーターを腰の左右に二つ、アシストする動きを大腿の上下(前後)だけに絞ることで、非常にシンプルな構造とバッテリー込み約2kgという軽さ、一般消費者でも購入しやすい価格を実現しました。 最大の特徴は、多数のセンサとAIによる動作推定エンジンで、着用者の動きや意図を検出して的確にアシストすること。 歩く・走る際にアシストが遅れれば逆に動きを邪魔することになり、階段などで意図しない向きに力が加われば危険ですが、ハイパーシェルは坂道や階段の昇降を含めて、着用者がどんな意図で動いたのかを素早く検出して、必要な力で補助することが謳い文句です。
2014年から先端テクノロジーの研究を論文単位で記事にして紹介しているWebメディアのSeamless(シームレス)を運営し、執筆しています。 1週間の気になる生成AI技術・研究をいくつかピックアップして解説する連載「生成AIウィークリー」から、特に興味深いAI技術や研究にスポットライトを当てる生成AIクローズアップ。 今回は、依頼主とクリエイターの直接取引で絵師を騙す、AIを用いた詐欺事案を取り上げます。 一見すると通常の依頼主として接触してくる詐欺師たちは、さまざまな方法でクリエイターの成果物を搾取しています。AIの精度向上でその詐欺手口も巧妙になってきました。 この詐欺の手口は計画的です。まず依頼主を装った詐欺師が、イラストの制作を依頼してきます。そして、作品が完成する前に報酬を先払いすると申し出ます。多くの絵師にとって、前払いは安心材料となるため、この提案を受け入れやすくなります。
Valve が新しいSteamハードウェアを3製品同時に発表しました。
2014年から先端テクノロジーの研究を論文単位で記事にして紹介しているWebメディアのSeamless(シームレス)を運営し、執筆しています。 この1週間の気になる生成AI技術・研究をいくつかピックアップして解説する今回の「生成AIウィークリー」(第120回)は、「トークン単位」ではなく「複数トークンの塊」で予測する計算効率を改善する技術「CALM」や、推論AIに複雑なパズルを解かせた後には有害な答えを生成するジェイルブレイク攻撃を取り上げます。 また、動画を再生しながら映像内の人や物を自在に動かせるAdobeの編集AI「MotionStream」や、イーロン・マスクの「Grokipedia」と「Wikipedia」がどれくらい類似し何が違うのかを調査した研究をご紹介します。 そして、生成AIウィークリーの中でも特に興味深いAI技術や研究にスポットライトを当てる「生成AIクローズアップ」で
2014年から先端テクノロジーの研究を論文単位で記事にして紹介しているWebメディアのSeamless(シームレス)を運営し、執筆しています。 1週間の気になる生成AI技術・研究をいくつかピックアップして解説する連載「生成AIウィークリー」から、特に興味深いAI技術や研究にスポットライトを当てる生成AIクローズアップ。 今回は、能力がある人とない人の仕事の増減をAI普及の前後で調査した論文「Making Talk Cheap: Generative AI and Labor Market Signaling」を取り上げます。 大規模言語モデル(LLM)の登場で、誰でも簡単に、非常に質の高い文章が作れるようになりました。この変化は、特に就職活動や仕事の応募といった場面で大きな影響を与えています。 ▲優秀な人がAIのせいで仕事が減少しているイラスト(絵:おね) かつては、応募先の企業や仕事内容
2014年から先端テクノロジーの研究を論文単位で記事にして紹介しているWebメディアのSeamless(シームレス)を運営し、執筆しています。 この1週間の気になる生成AI技術・研究をいくつかピックアップして解説する今回の「生成AIウィークリー」(第119回)は、中国発マルチモーダル大規模言語モデル「Emu3.5」や、無限に拡張できる3Dバーチャル世界を生成可能な「WorldGrow」を取り上げます。 また、GPT-5の精度と同等の軍事用独自AI「EdgeRunner 20B」や、1万6000以上の既存APIから必要なツールを自律的に選び実行するAIエージェント「DeepAgent」をご紹介します。 そして、生成AIウィークリーの中でも特に興味深いAI技術や研究にスポットライトを当てる「生成AIクローズアップ」では、AIチャットボットへの入力(プロンプト)が、実はすべて保存されていたことを
テクニカルジャーナリスト。東京工芸大学特別講師。monoAI Technology顧問。IT技術、半導体技術、映像技術、ゲーム開発技術などを専門に取材を続ける。スポーツカー愛好家。 自分はYouTubeでゲーム実況のライブ配信を普段からよくやっているくらいなので、結構ゲームをプレイする方である。しかし、意外なことに、こうした携帯型ゲーミングPC(以下、ゲーミングUMPC。UMPCはウルトラモバイルPCの略)でプレイする機会がほとんどなかった。 普段のゲーム実況は、デスクトップPCで行っているし、出張の際などにゲームをプレイする際は、17インチサイズのゲーミングノートPC(GeForce RTX 3070 Ti Laptop搭載)でプレイしていたので、ゲーミングUMPCは持っていなくても困らなかった。 ▲現在の愛機GIGABYTEの「AERO17」(XE5-73JP744HP)。GeForc
2014年から先端テクノロジーの研究を論文単位で記事にして紹介しているWebメディアのSeamless(シームレス)を運営し、執筆しています。 1週間の気になる生成AI技術・研究をいくつかピックアップして解説する連載「生成AIウィークリー」から、特に興味深いAI技術や研究にスポットライトを当てる生成AIクローズアップ。 今回は、AIチャットボットへの入力(プロンプト)が、実は処理過程で失われていなかったことを証明した論文「Language Models are Injective and Hence Invertible」を取り上げます。スイス連邦工科大学ローザンヌ校(EPFL)やイタリアのローマ・サピエンツァ大学に所属する研究者らによる研究報告です。 ChatGPTのような言語モデルに文章を入力すると、モデルの内部で複雑な計算が行われますが、その過程で元の入力文章の情報が失われているので
Soraアプリを使うと、自分の顔と声を出演させたり、ペットやキャラクターと共演したりすることができる「カメオ」が利用できます。ただ、自分はiPhoneのカメラに写っている自分しか登録できませんし、キャラクターは実写の人間は不可となっています。 キャラクターをカメオ登録するには、数秒分の動画をアップロードする必要がありますが、これが実写の人間だとはねられます。 妻のイラストを3D化したキャラクターと遊ぶしかないなあと思っていたら、Soraのキャラクターカメオが、いったんSoraの中で生成された動画から登録できるということを、西川和久さんから教えてもらいました。きのう、追加されたようです。 ということは、いったん生成された動画内に実在の人物に似た人がいれば、それをキャラクターとして登録できるということ。 筆者はプロンプトだけで本人に寄せていくというテーマを追求していたため、妻に似た動画をSor
ロジ高級マウスのフラッグシップ MX Master 4 を試してみました。 MX Master 4は、Logitech / Logicool製マウスの最高峰MX Masterシリーズ6年ぶりの新世代製品。 ボタンやホイール、全体の形状は継承しつつ、親指を置くサムレスト部分がプルッと震える新機能ハプティックフィードバックが最大の売りです。 一見した限りあまりMX Master 3 / 3Sと変わらず、実質は振動追加だけかな?と思っていたら、実機を触ると使い勝手にかかわる変更や改善が多数。 メーカーからお借りした製品版を試して気付いた点や触った感触を書き出します。 「センスパネル」がプルッと振動。アプリ対応はこれからまずは目玉のハプティックフィードバックから。ゲーム機やスマホのように、繊細な振動で手応えを伝える機能です。 具体的には、親指を置くサムレスト部分が「センスパネル」なる名称に。マウス
[名称] Zip、Zip Disk、Zip 100 Disk (参考製品名 「Zip 100 Disk」) [種類] 磁気ディスク [記録方法] 磁気記録 [メディアサイズ] 98.0×98.9×6.4mm [記録部サイズ] 直径約93mm [容量] 100MB [登場年] 1994年頃~ ひとつ、またひとつと消えていき、記憶からも薄れつつあるリムーバブルメディア。この連載では、ゆるっと集めているメディアやドライブをふわっと紹介します(※本記事は2022~2025年に掲載した連載「ロストメモリーズ/著:宮里圭介」を再掲出したものです)。 ロストメモリーズの記事一覧 | テクノエッジ TechnoEdge 「Zip」は、Iomega(アイオメガ)社が開発した磁気ディスク。当時のリムーバブルメディアとしては、容量が100MBと大きかったこと、また、速度が最大約1.4MB/sとそれなりに高速だっ
OpenAIは動画生成SNSのSoraをアップデートし、日本、韓国、米国、カナダで招待なしで加入することが可能になりました。 また、ペットなどの本人以外のキャラクターをカメオとして登録することもできるようになりました。リアルな人間は登録できませんが、動画があればペットなどでもOK。 SoraのSNSへの加入にはiPhoneまたはiPadが必要なのは変わらず。Android版Soraアプリは近日提供予定のままです。 というわけで、21歳で天寿をまっとうした我が家最後のネコ「メソ」の動画を引っ張り出して、キャラクターとしてカメオ登録しました。 カメオ登録のところに「キャラクターを追加する」というコマンドが増えているので、それを選択。 登録するにはアップロードした動画の中から数秒分を範囲選択します。声も登録したかったので、鳴き声が入っているところを短く編集してアップロードしました。 アップロード
発表によれば、UMGとUdioは正式なパートナーシップを結び、AIによる音楽創造の新しい枠組みを「業界公認」の形で進めることになりました。 アーティストの許可制AI音楽へUdioのCEO、アンドリュー・サンチェス氏は同社の公式ブログで次のように述べています。 アーティストとソングライターがAIの恩恵を直接受けられるようにする。これが今日の第一歩だ この提携によって、Udioでは今後、 アーティストが自らの声やスタイルの使用を許可・管理できる ファンがその範囲内で新しい曲を生成・リミックスできる という「許可制AI音楽」の仕組みが導入される予定。 つまり、AIが勝手に誰かの声を模倣する時代から、アーティストが自らAIをコントロールし、ファンと協創する時代へと進化することになります。 歌声のコントロールについては、UdioはVoice Controlという機能を最近実装しています。いくつかのテ
レノボ・ジャパンは新型スマートグラス「Lenovo Legion Glasses(Gen2)」を10月24日に発売。28日に製品体験会を開催し、9月に発売されたタブレット2モデル「Lenovo Yoga Tab」「Lenovo Idea Tab Plus」と合わせてメディア向けのハンズオン(体験会)を実施しました。 わずか65g、超軽量設計スマートグラス「Legion Glasses(Gen2)」Legion Glasses(Gen2)は、Gen2とある通り2世代目の製品となります。初代は日本では発売されなかったため、国内向けとしては初のLegion Glasses(日本語の発音は“レギオン グラス”)となります。 最大の特徴は65gという超軽量設計です。XREALなどのスマートグラスが太めのフレームを採用するのに対し、Legion Glasses Gen2は細身でシンプル。見た目は、ほぼ
[名称] SFメモリカセット、GBメモリカートリッジ (参考製品名 「SHVC-P-MMSA」「DMG-P-MMSA」) [種類] フラッシュメモリー+SRAM [記録方法] Loppi [メディアサイズ] 128×88×20mm、57×65×7.8mm(実測) [記録部サイズ] ---- [容量] 32Mbit+256kbit(SFメモリカセット)、8Mbit+1024kbit(GBメモリカートリッジ) [登場年] 1997年頃~ ひとつ、またひとつと消えていき、記憶からも薄れつつあるリムーバブルメディア。この連載では、ゆるっと集めているメディアやドライブをふわっと紹介します(※本記事は2022~2025年に掲載した連載「ロストメモリーズ/著:宮里圭介」を再掲出したものです)。 ロストメモリーズの記事一覧 | テクノエッジ TechnoEdge 「SFメモリカセット」「GBメモリカートリ
2014年から先端テクノロジーの研究を論文単位で記事にして紹介しているWebメディアのSeamless(シームレス)を運営し、執筆しています。 この1週間の気になる生成AI技術・研究をいくつかピックアップして解説する今回の「生成AIウィークリー」(第118回)は、既存の大規模言語モデル(LLM)を特定タスク向けに1.58ビット精度にファインチューニングする軽量アプローチ「BitNet Distillation」や、写真1枚から複数視点画像、動画までを入力に高精度3D空間を生成できるAIモデル「HunyuanWorld-Mirror」を取り上げます。 また、テキストを画像に変換してからAIモデルで効率的に処理するアプローチを提案した論文2本、DeepSeekが発表したOCRモデルと、アレン人工知能研究所などの研究チームが既存マルチモーダルLLMで試した研究をご紹介します。 そして、生成AIウ
NotebookLMの動画解説で使われているイラストのレベルの高さは以前から注目されていましたが、その中に「カワイイ」「アニメ」が追加されていたのです。 米国・英語版だけでなく、全世界でローリングアウト中ということですが、筆者の環境ではすでに使えていたので、さっそく試してみました。 このうち「カワイイ(Kawaii)」は初登場なのですが、「アニメ」は10月13日に登場済み。この時点で、動画解説で使われている画像がNano Bananaベースになり、そのテーマも選択可能になっていたのでした。 最近、NotebookLMのイラストのレベルが爆上がりしているなと感じていたのはそのせいだったのですね。 ただ、そこで描かれていたアニメが80年代の古いスタイルで、皆様からのご要望が「アニメじゃない」「本物の(現代的な)アニメをよこせ」だったため、完全に作り直したのだそうです。 では、その努力の成果を見
慶應義塾大学卒業後、新卒で出版社の宝島社に入社。独立後はケータイジャーナリスト/ライターとして幅広い媒体で執筆、コメントなどを行う。ケータイ業界が主な取材テーマ。 NTT西日本は、音声AI事業の「VOICENCE(ボイセンス)」を発表しました。 NTTが持つ音声技術やトラスト技術を生かし、声の持ち主を守りながら、音声AIによる事業機会を拡大していくという取り組み。音声AIにはNTTの持つ音声処理技術を活用。その音声AIで生み出したコンテンツを、ブロックチェーンなどを用いて真正性証明をつけ、流通させていくのが狙いです。 ▲NTT西日本が新事業として始める音声AI事業のVOICENCE ▲トラスト技術と音声処理技術を掛け合わせたものになる 当初は声優や俳優、芸人といったコンテンツを生み出す立場の人や事務所と共同でコンテンツを拡大していく方針。そのIP(知的財産)を守るために、声の真正性証明をV
次のページ
このページを最初にブックマークしてみませんか?
『テクノエッジ TechnoEdge』の新着エントリーを見る
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く