OpenAI(オープンAI)とは?使い方やビジネスでの活用方法を解説

どんな質問にも人間らしい自然な口調で答えてくれるチャットボット「ChatGPT(読み:チャット・ジーピーティー)」が大きな話題を集めたことで、AIを専門とする企業のみに限らず、あらゆる方面から注目されている団体「OpenAI(オープン・エーアイ)」。ChatGPTのほかにも、入力した言葉や文から画像を生成できるAIなど、さまざまなAIモデルを開発している研究機関で、その可能性に不安や期待を抱く人は少なくありません。

この記事ではビジネスオーナーがおさえておきたいOpenAIの概要や、活用のしかたを解説します。

目次


OpenAIとは

OpenAIとは米サンフランシスコに拠点を構える、AI(人工知能)を専門とする非営利研究機関です。AIとひと口に言ってもその種類は多岐に渡ります。OpenAIの強みは、膨大なデータから学習し、新たなテキストや画像、音声を生み出す「ジェネレーティブAI(生成AI)」です。AIモデルのトレーニングに使用されているのは、2016年から提携関係を結んでいるマイクロソフトのクラウドプラットフォーム「Azure(アジュール)」で、同社からの投資額は110億ドル(約1.5兆円)にも上ります。

参考:マイクロソフトがOpenAIへ「1.3兆円投資」のワケ、ChatGPTで対グーグルとOffice強化(2023年1月25日、ビジネス+IT)

OpenAIではほとんどのAIモデルに高性能な言語モデル「GPT-N」を使用していることも特徴的でしょう。GPTとは「Generative Pre-trained Transformer」の略語で、易しくいうと人間のような文章を生成できる言語モデルです。「GPT-2」、「GPT-3」といった形で進化を遂げ、2023年3月時点では「GPT-4」まで発表されています。

OpenAIのはじまり

OpenAIが設立されたのは、2015年。「Airbnb」や「Dropbox」への投資を成功させてきた投資会社「Yコンビネーター」の元代表、サム・アルトマン氏が現在トップに立っています。

OpenAIは一人の手で始まったわけではありません。共同創業者や出資者には、テスラやTwitterの代表であるイーロン・マスク氏、LinkedIn共同創業者のリード・ギャレット・ホフマン氏、Stripeの元CTOであるグレッグ・ブロックマン氏など、研究者・起業家・投資家の有力者をかき集めたような錚々たるメンバーが名を連ねています。

参考:How to Start a Startup(Sam Altman)

設立当初はマスク氏が参画したことが大きく取り上げられましたが、すでに経営からは退いており、以降、OpenAIとの関係性は変わりつつあるようです。特にOpenAIが営利企業である「OpenAI LP」を創設してからは、団体の動きを疑問視するような発言を度々しており、マスク氏自身も対抗馬となるAIの開発に取り組みはじめているそうです。

参考:
AI研究組織OpenAI、「上限付き」営利企業OpenAI LPを創設(2019年3月12日、CNET Japan)
Elon Musk lashes out at the ChatGPT sensation he helped create after Microsoft’s massive investment —‘Not what i intended’(2023年2月18日、Fortune)
Elon Musk yearns for AI devs to build ‘anti-woke’ rival ChatGPT bot(2023年3月6日、The Register)

OpenAIの年表

OpenAIにまつわる重要な出来事を、ざっと以下の年表から見てみましょう。

2015年……OpenAI設立
2016年4月……強化学習の開発用ツールキット「OpenAI Gym」のベータ版を公開
2016年11月……マイクロソフトとの提携の締結を発表
2016年12月……AI学習プラットフォーム「Universe」を公開
2018年……イーロン・マスク氏が退任、言語モデル「GPT-1」を発表
2019年3月……資金調達力を上げるため、営利企業「OpenAI LP」を設立
2019年11月……GPT-1を改良した「GPT-2」を発表
2020年6月……OpenAI APIとともに「GPT-3」を公開
2021年8月……テキスト指示をコードに変換するAIモデル「OpenAI Codex」を公開
2021年1月……テキストを画像に変換するAIモデル「DALL·E」のベータ版を発表
2022年9月……音声の文字起こしと翻訳ができる音声認識AIモデル「Whisper」を発表
2022年11月……対話型AI「ChatGPT」を公開
2022年12月……3Dモデルを生成するAI「Point-E」をリリース
2023年1月……米マイクロソフトが、OpenAIに100億ドルの巨大投資をすると発表
2023年3月……「ChatGPT」と「Whisper」のAPIを公開、「GPT-4」公開

参考:
Blog(OpenAI)
Research Index(OpenAI)

OpenAIで開発されているAIモデル

ここではOpenAIが開発した主要のAIを簡単に説明していきます。

OpenAI Codex

発表時期:2021年8月

「OpenAI Codex」はテキストで指示を書くだけで必要なコードを教えてくれるAIです。現時点ではベータ版を無料で利用することができます。対応しているプログラミング言語は幅広く、Pythonをはじめ、JavaScript、Go、Perl、PHP、Ruby、Swift、 TypeScript、SQL、Shellなどが書けるようです。主に開発者向けといえるでしょう。「Codex JavaScript Sandbox」または「Playground」から試してみることができます(※)。

※:利用にはOpenAIのアカウントが必要です。

参考:
OpenAI Codex(2021年8月10日、OpenAI)
Code completion(OpenAI)

DALL·E

発表時期:2021年1月

「DALL·E」は入力欄に打ち込んだテキスト内容をほんの数秒で画像に変換してくれる、画像生成AIです。現状日本語では指示ができないようなので、英語で「キャッシュレス決済 ピカソ風」と指示したところ、以下の画像が生成されました。

jp-blog-openai01

このように、この世に存在しない画像を簡単なテキスト指示で作り出すことができます。偽画像がネットに次々と出現するのではと思うかもしれませんが、著名人の名前は検索できなかったり、政治目的では利用ができなかったりと最低限の規制はされているようです。詳しい方針はこちらに記載されています。

DALL·Eはここから試してみることができます。生成できる画像の数には、1カ月ごとの上限があるようです(※)。

※画像を生成するごとにクレジットが消化されます。登録した初月は50クレジット、2カ月目以降は毎月15クレジットが付与されます。追加購入も可能だそうです。詳細はこちら

Whisper

発表時期:2022年9月

Whisperは、音声データをもとに文字起こしができる音声認識モデル(※)です。OpenAIの紹介によると、ネット上にある680,000時間の音声データをもとにトレーニングされ、会話から歌までの文字起こしができるそうです。まだ正確とは言い切れませんが、文字起こしの内容を別の言語に翻訳する力も兼ね備えています。

※AIが音声を認識したうえで、データ化する技術のこと。

便利そうにも聞こえますが、DALL·Eのように特定のリンクからすぐには利用できず、実際に利用するにはコードを実行できる環境などが必要だそうです。

最大30秒の音声ファイルという制限はありますが、「Hugging Face」というプラットフォームでは、その技術を試せるデモ版が公開されています。精度が気になる人は試してみるといいでしょう。

2023年3月には、誰もが使用できるAPIが公開され、アプリなどへの組み込みもできるそうです。

ChatGPT

発表時期:2022年11月

ChatGPTは、まるで人間が返信しているのかと錯覚するほど自然に受け答えができる、対話型AIです。有料プランもありますが、このリンクからなら無料で使えます(※)。

※アカウントの作成が必要です

人間との大きな違いはどんな問いかけにもそれなりの精度で返信してくれるところでしょう。複数の言語も流暢に操れます。ただ現時点では2021年以降の情報に乏しいようで、誤った情報をあたかも本当かのように語ることもあるため、注意が必要です。

ChatGPTは自身の弱点を以下のように把握していました。

jp-blog-openai02

参考:ChatGPT General FAQ(OpenAI)

詳しい仕組みや課題などは「ChatGPTとは?使い方や仕組み、注意点を紹介!」の記事もご参考ください。

OpenAIが注目されている理由

OpenAIの年表OpenAIで開発しているAIの章からは、OpenAIが複数のAIモデルを次々と開発していることが分かります。なかでも最も注目を集めているのは、やはり「ChatGPT」でしょう。

公開から1週間も経たないうちに利用者数は100万人を突破、2カ月もするとその数は1億人にまで上りました。この驚異的な成長は過去の事例と比べても群を抜いています。たとえばFacebookでは100万人に達するのに10カ月、Netflixでは3年半ほどかかったそうです。

参考:
[新連載]史上最速で利用者1億人突破のChatGPT、焦るグーグル「破壊」の危機(2023年2月7日、日経ビジネス)
ChatGPT hit 1 million users in 5 days: Here’s how long it took others to reach that milestone(2023年2月13日、The Indian Express)

ChatGPTが登場すると、多くの人は以下の点に注目しました。

  • 仕事が奪われてしまうかもしれない
  • 検索エンジンをはじめ、これまでのインターネットサービスの使い方が根本から変わってしまうかもしれない

ある種の恐怖と共に関心を持つ人がいる一方で、計り知れぬ力に期待を寄せる人も少なくありません。特に以下のように、作業効率化を期待する声は多いようです。

  • 反復して行う単純作業を効率化できるかもしれない
  • オープンソースのAPIを提供しているため、アプリなどに組み込みやすい

AIの導入にはある程度の予算を割かなければいけない印象を持つかもしれませんが、OpenAIではAPIなどを無料で公開していることもあり、より容易にビジネスなどに取り入れることができるかもしれません。

ビジネスにどのように生かせるかは、「ビジネスでOpenAIを活用するには」の章で詳しく説明します。

OpenAIの競合は?

OpenAIのAIモデルの競合を以下にいくつか紹介します。

(1)Bard(バード)

「Bard」は、Googleが開発している対話型AIです。言語モデルには「LaMDA」を採用しています。AIの開発競争では少し後れをとっているものの、2023年3月には試験版を地域限定で公開しています。

GoogleはAIを積極的に自社サービスに取り入れようと動いており、将来的にはGoogle Workplaceに画像生成・テキスト生成AIなどを組み込むことを発表しています。

参考:
Google、会話型AI「Bard」の登録を開始。「検索の補完」へ(2023年3月22日、Impress Watch)
The next generation of AI for developers and Google Workspace(2023年3月13日、Google)

(2)Claude(クロード)

2021年に設立されたスタートアップ「Anthropic(アンソロピック)」の「Claude(クロード)」も、多くの人が関心を寄せている対話型AIです。創業者のダリオ・アモデイとダニエラ・アモデイきょうだいはOpenAI出身で、GPT-2とGPT-3の開発にも携わっていました。

2023年初頭にはGoogleが同社に500億円ほど投資しており、AI構築に必要な計算能力を提供するそうです。

参考:Google Invests Almost $400 Million in ChatGPT Rival Anthropic(2023年2月4日、Bloomberg)

(3)BLOOM(ブルーム)

AWS(Amazon Web Services)とパートナーシップを組んだ米ニューヨーク発の「Hugging Face」では、GPT-4に対抗する言語モデル「BLOOM」を開発しています。完成次第、AWS(Amazon Web Services)に導入されるそうです。

(4)Stable Diffusion(ステーブル・ディフュージョン)

Stable Diffusionはイギリス発「StabilityAI」が開発した画像生成AIで、OpenAIのDALL-Eの競合です。同社の日本法人によると、日本語に特化した対話型AI「Stable Chat」も開発予定だそうです。

Stable Diffusionを試してみる>>>

参考:
Design platform Canva launches text-to-image AI feature(2022年11月10日、The Verge)
日本語特化のチャットボット「Stable Chat」開発発表。Stability AI日本公式が告知(2023年2月21日、PC Watch)

(5)LLaMA (Large Language Model Meta AI)

BLOOMと同じように、GPT(現在の最新版はGPT-4)の対抗馬としてメタが開発しているのが、大規模言語モデル「LLaMA」です。AI分野での研究をより容易にすることを目標に掲げており、研究者に限定して提供していく予定だそうです。

参考:Meta、新たな大規模言語モデル「LLaMA」(2023年2月27日、Impress Watch)

OpenAIの競合となるAIは、上記以外にもまだまだたくさんあります。たとえば中国では検索エンジンのBaiduやアリババグループ、テンセント・ホールディングスもチャットボットの開発に乗り出しているようです。AI開発の動向が気になる場合は、自ら調べてみるといいでしょう。

参考:
中国テンセント、ChatGPT的製品の開発チーム設立=関係筋(2023年2月27日、ロイター編集)
Baidu to implement ChatGPT-like Ernie Bot chatbot from March(2023年2月23日、AP News)

OpenAIのAIモデルをビジネスに活用するには

OpenAIのAIモデルは、あらゆる事業に役立てられる可能性があります。AIモデルごとに分けて、活用方法を見ていきましょう。

ChatGPT

ChatGPTは、自分の弱点をカバーする複数の補佐役を凝縮したような存在といえるかもしれません。たとえば以下のような業務で力を発揮します。

  • 英語でのメールの読み書き、英文の翻訳
  • 商品説明をもっとわかりやすくする
  • キャッチコピーの案を出す
  • 売上分析に役立つエクセルの数式の提案

詳しく見ていきましょう。

英語をはじめとする外国語の文章は、言語を勉強しないと素早く正確に理解することは難しいと思われがちでしたが、ChatGPTなら原文とともに「翻訳して」と指示を出すだけで、すぐに精度の高い翻訳を返してくれます。誤訳の可能性もあるため、概要をある程度つかむ感覚で活用するといいかもしれません。

ChatGPTはある程度の校閲もできるようなので、「商品説明がどうしても回りくどくなってしまう」などの悩みがある場合には助けを求めてみてもいいかもしれません。

さらに商品内容を説明すれば、キャッチコピーをいくつか提案してくれます。早速活用している企業もいるそうで、たとえばAIの提案をもとに人間がさらに手を加えていくような使われ方も想定できます。

参考:対話式AIで仕事が変わる?ChatGPTの衝撃(2023年3月14日、NHKニュース)

売上分析などにエクセルを使用している場合、「これができたら効率的だけど、やりかたがわからない……」と思っている人もいるかもしれません。こういった疑問についても投げかけることができます。簡単な数式については、正確に答えてくれることが多いようです。

ただしChatGPTの弱点として、誤った情報を自信たっぷりに語ることがあります。「実のところはわかりませんが」のような前置きがないこともあるため、回答は鵜呑みにしないよう気をつけましょう。

DALL·E

入力したテキストをもとにどんな画像も生成してくれるDALL·Eには、以下のようなことを求めることができます。

  • 商品構想を練るためのムードボード
  • ロゴの案
  • ウェブサイトのレイアウト案
  • 広告ポスターのイメージ案
    など

たとえば新商品の構想を練るとき、チーム内で共通認識を持とうと、思い描いているものに近い画像を集めた「ムードボード」を作ることがあるかもしれません。ただし検索エンジンなどに掲載されている画像はすでに存在しているものがほとんどで、未だかつてないものは見つけづらいものです。より斬新な考えを生み出したい場合にはDALL·Eが便利かもしれません。

たとえば以下は「日に照らされたプール付きの屋内ラウンジ 透き通る水が溜まったプールと、パステルピンク色の透き通った水が溜まったプール どちらも大きな窓の横に設置 デジタルアートで表現」という指示のもと、生成された画像です。指示は細かければ細かいほど、イメージに近づけることができるでしょう。

jp-blog-openai03

ロゴも同様です。以下では「レストラン用のロゴ カトラリー 英字 シンプル」と指示しています。DALL·Eを活用することで、自分では思い浮かばなかったようなアイデアが湧き出てくるかもしれません。

jp-blog-openai04

実際に女性向けの雑誌、コスモポリタンのアメリカ版ではDALL·Eの機能「Outpainting」を使用し生成した画像を、雑誌の表紙に採用したそうです。このような活用方法はひょっとしたら今後少しずつ増えていくかもしれません。

補足までに、商用利用については、DALL·Eのサイト上に掲載されている「コンテンツの方針についてよくある質問事項」に、「可能」と記述されています。

参考:The World’s Smartest Artificial Intelligence Just Made Its First Magazine Cover(2022年6月21日、Cosmopolitan)

Whisper

音声ファイルの文字起こしができるうえに、得意でない言語なら文字起こしに加えて翻訳までしてくれると聞くと、とても頼もしい印象を抱くかもしれません。

たとえば外国人のお客様が来店したときに、翻訳ツールのように使うこともできるでしょう。ネットで見つけた動画の音声を録音すれば、海外の動画も簡単に理解できるようになるかもしれません。

ただし前述の通り、現時点の利用方法はHugging Faceにあるデモ版に限られているようです。2023年3月にはAPIがオープンソース化されたため、今後さまざまな企業でアプリなどに組み込まれることが考えられます。

参考:Introducing ChatGPT and Whisper APIs(2023年3月1日、OpenAI)

OpenAIの今後

OpenAIは自社の言語モデル「GPT-1」を2018年に発表してから、破竹の勢いで改良を重ねてきました。発表から5年が経った2023年には、早くも「GPT-4」まで公開されています。

2023年3月に公開されたGPT-4は目覚ましい能力を発揮しており、GPT-3.5の試験結果と比べるとその違いは一目瞭然です。

jp-blog-openai04

特に理数系の能力が伸びていることが上記の棒グラフからはわかります。詳しい研究内容はGPT-4について記したページからも確認できますが、多言語を正確に理解する能力が向上していたり、「爆弾はどう作りますか」など人々に危険をおよぼす質問には答えを提供しないようトレーニングされていたりと総体的な向上が図られていることがうかがえます。

できるだけ偏見をなくし、回答の精度を高め、人々に危険をもたらす情報を開示しないことは今後も課題として挙げられますが、対応能力がみるみると向上していることから、AIが生活に浸透しはじめる日もそう遠くはないといえそうです。たとえばOpenAIの技術を使用したアプリの登場や、OpenAIのAIモデルをビジネスに活用するにはの章でも紹介した活用方法の定着などが予想できるでしょう。

OpenAIの最新情報は、以下のリンクから確認できます。

ネットショップを無料で開始するならSquare

EC作成から、オンライン決済、店舗連動の在庫管理まで、便利な機能が無料で簡単に始められます。

今、世界的に注目されているChatGPTはもちろん、さまざまな種類のジェネレーティブAIを生み出している、米OpenAI。この記事からは、アプリなどを開発する力を持つ大企業から、個人事業主までさまざまな規模の事業者が役立てられるAIモデルを抱える団体であることがわかりました。なかでもChatGPTは利用しやすいですが、正確さに欠ける情報を出力することもまだあります。どのAIモデルも利用の際には参考程度にとどめておくことが、今のうちは無難かもしれません。


Squareのブログでは、起業したい、自分のビジネスをさらに発展させたい、と考える人に向けて情報を発信しています。お届けするのは集客に使えるアイデア、資金運用や税金の知識、最新のキャッシュレス事情など。また、Square加盟店の取材記事では、日々経営に向き合う人たちの試行錯誤の様子や、乗り越えてきた壁を垣間見ることができます。Squareブログ編集チームでは、記事を通してビジネスの立ち上げから日々の運営、成長をサポートします。

執筆は2023年4月11日時点の情報を参照しています。当ウェブサイトからリンクした外部のウェブサイトの内容については、Squareは責任を負いません。
Photography provided by, Unsplash