「Grok(グロク)」とは?Grok-1.5の特長やGPT・Claudeとの性能を比較
更新日:2024年07月10日
公開日:2024年05月09日
Grok-1.5Vは、xAI社が開発した第一世代のマルチモーダル モデル。Xで使用できる対話型AI「Grok(グロク)」に搭載されています。特長は、テキスト処理能力に加え、文書、図、チャート、写真などさまざまな視覚情報の処理が可能。
この記事ではGrok-1.5の特長や他のAIと性能比較を解説します。
目次
Grok(グロク)とは
対話型AI「Grok」はイーロン・マスク氏が設立したxAI社が開発した生成AIのことです。
Grokは、Xを利用してリアルタイム情報にアクセスできることや、他の対話型AIよりもユーモア感のある自然な回答が可能であることが特長です。また、Grokには「Fun Mode」と「Regular Mode」の2つのモードがあります。Fun Modeを選ぶとよりウィットに富んだ会話が楽しめる。
参考:X(旧Twitter)、対話型AI「Grok(グロク)」を搭載、イーロン・マスク氏が設立したxAI社の生成AI
Grok-1.5Vの性能や特長
ここからはGrok-1.5Vの性能や特長について解説していきます。
Grok-1.5Vの性能や特長①他生成AIとの比較
特に注目すべき指標は「Mathvista(数学)」と「RealWorldQA(現実世界の理解)」が挙げられるでしょう。この2つの指標においてはベンチマークしている他AIよりスコアが上回っています。
参考:xAI「Grok-1.5 Vision Preview」
Grok-1.5Vの性能や特長②図からコードを書く
さらにGrok-1.5Vの特長として、画像認識能力があります。手書きのフローチャートやスクリーンショット、写真などの解析能力において、他のマルチモーダルモデルと競争力があるとされています。
以下の例のように、手書きされたフローチャートをPythonのコードに変換するようGrokに指示し、コードが生成されたことが示されています。
Grok-1.5Vの性能や特長③ミームを説明する
Grok-1.5Vは画像を認識し、それがユーモアを表したものだと理解することもできます。回答では、スタートアップと大企業の比較をユーモラスに表現。
Grok-1.5Vの性能や特長③現実世界を理解
実際の世界で使えるAIアシスタントを作るためには、物理的な世界についてよく理解する必要があります。この目標に向かって、新しいテスト「RealWorldQA」が始められました。
このテストは、AIが現実世界をどれくらい理解できるかを見るために作られたもの。以下に質問と回答がありますが、現実世界のルールに則した回答がされていると考えられます。
Grok-1.5Vのさらなるアップデートに期待
これらの性能や特長は2024年4月時点のもの。今後のアップデートで、さらにデジタル世界と物理世界を繋いでくれることに期待が高まります。
参考:xAI「Blog」
AIツールで商談の成果UP &育成の効率化を実現
オンラインでも、オフラインでもAIが議事録を自動作成してくれる営業・育成支援AIツール「ACES Meet」。
このツールは、商談やミーティング中の様子を録画、AIが自動で文字起こし、議事録の作成まで行えます。また、話しているスピードや内容などをAIが解析し、どんなトピックにどれくらい時間を使ったのか、重要な箇所はどこなのかを分かりやすく表示します。
この議事録を見ることで、振り返りやナレッジの蓄積、タスクの抜け漏れ防止にもなります。また、トッププレイヤーの録画映像は、生きた教材となり、良質なOJTとなるでしょう。
まずは情報収集として、お気軽に資料をダウンロードしてみてください。