Sepanjang tahun 2023, kami telah memperkenalkan inovasi AI baru yang luar biasa kepada customer, komunitas developer, dan pengguna yang lebih luas, termasuk AI Hypercomputer untuk melatih dan melayani model AI generatif seperti dukungan AI generatif di Vertex AI, platform AI Enterprise seperti Duet AI in Google Workspace, juga Duet AI for Google Cloud Platform. Kami menyediakan sejumlah kemampuan baru dalam infrastruktur AI yang dioptimalkan dengan kemajuan penting pada GPU, TPU, perangkat lunak dan kompiler ML, manajemen beban kerja dan lainnya, juga banyaknya inovasi Vertex AI dan rangkaian lengkap kemampuan baru dengan agen Duet AI dalam Google Workspace dan Google Cloud Platform.
Kami telah melihat pertumbuhan developer dan pengguna yang luar biasa. Contohnya antara Q2 dan Q3 tahun ini, jumlah proyek AI generatif yang aktif di Vertex AI tumbuh lebih dari tujuh kali lipat. Merek terkemuka seperti Forbes, Formula E, dan Spotify juga menggunakan Vertex AI untuk membangun agen mereka sendiri, sedangkan Anthropic, AI21 Labs, dan Cohere melatih model mereka. Cakupan dan kreativitas aplikasi yang dikembangkan customer sungguh menakjubkan. Fox Sports membuat konten yang lebih menarik. Priceline membangun konsultan perjalanan digital. Six Flags membangun concierge digital. Sedangkan Estée Lauder membangun brand manager digital.
Hari ini, kami memperkenalkan sejumlah kemampuan baru yang penting di seluruh susunan AI kami untuk mendukung Gemini, model yang paling mumpuni dan komprehensif hingga saat ini. Gemini dibangun dari awal untuk menjadi multimodal, yang berarti dapat menggeneralisasi dan memahami, beroperasi luas, dan menggabungkan berbagai jenis informasi secara mulus, termasuk teks, kode, audio, gambar, dan video, dengan cara yang sama seperti manusia melihat, mendengar, membaca, mendengarkan, dan berbicara tentang berbagai jenis informasi secara bersamaan.
Susunan AI terpadu Google Cloud
Mulai hari ini, Gemini merupakan bagian dari susunan teknologi AI yang terintegrasi dan dioptimalkan secara vertikal, yang terdiri dari beberapa bagian penting yang semuanya dirancang untuk bekerja bersama:
Infrastruktur AI yang sangat dapat diperluas (super-scalable): Google Cloud menawarkan infrastruktur AI terkemuka yang dioptimalkan untuk perusahaan, sama dengan yang digunakan Google, untuk melatih dan melayani model. Kami menawarkan infrastruktur ini kepada Anda di wilayah cloud kami sebagai layanan, untuk dijalankan di pusat data Anda dengan Google Distributed Cloud, dan di edge. Seluruh susunan infrastruktur AI kami dibangun dengan co-desain tingkat sistem yang meningkatkan efisiensi dan produktivitas di seluruh pelatihan, penyetelan, dan penyajian AI.
Model kelas dunia: Kami terus menghadirkan berbagai model AI dengan keterampilan berbeda. Pada akhir tahun 2022, kami meluncurkan Pathways Language Model (PaLM) yang kemudian secara cepat diikuti oleh PaLM 2, dan sekarang kami menghadirkan Gemini Pro. Kami juga telah memperkenalkan model khusus domain seperti Med-PaLM dan Sec-PaLM.
Vertex AI, platform AI perusahaan terkemuka untuk developer: Untuk membantu developer membangun agen dan mengintegrasikan AI generatif ke dalam aplikasi mereka, kami telah meningkatkan Vertex AI, platform pengembangan AI kami dengan cepat. Vertex AI membantu customer menemukan, menyesuaikan, menambah, menerapkan, dan mengelola agen yang dibangun menggunakan API Gemini, serta daftar kurasi lebih dari 130 model AI open-source dan pihak ketiga yang memenuhi standar keamanan dan kualitas perusahaan Google yang ketat. Vertex AI memanfaatkan kontrol tata kelola data dan privasi bawaan Google Cloud, dan juga menyediakan tooling untuk membantu developer menggunakan model secara bertanggung jawab dan aman. Vertex AI juga menyediakan Search dan Conversation, tool yang menggunakan pendekatan low-code untuk mengembangkan pencarian yang canggih, dan agen percakapan yang dapat bekerja di banyak saluran.
Duet AI - agen AI pendamping untuk Workspace dan Google Cloud: Duet AI adalah kolaborator kami yang didukung AI yang memberikan bantuan kepada pengguna saat mereka menggunakan Google Workspace dan Google Cloud. Duet AI di Google Workspace, misalnya, membantu pengguna menulis, membuat gambar, menganalisis spreadsheet, menyusun dan meringkas email dan pesan chat, serta meringkas rapat. Duet AI di Google Cloud, misalnya, membantu pengguna dalam hal coding, menyebarkan, menskalakan, dan memantau aplikasi, serta mengidentifikasi dan mempercepat penyelesaian ancaman keamanan siber.
Kami sangat antusias untuk mengumumkan pembaruan di masing-masing area ini:
Memperkuat infrastruktur kelas dunia kami
Seiring dengan meningkatnya ukuran dan kompleksitas model AI generatif, demikian pula persyaratan pelatihan, penyetelan, dan inferensi. Akibatnya, permintaan akan infrastruktur AI berkinerja tinggi, sangat skalabel, dan hemat biaya untuk melatih dan melayani model meningkat secara eksponensial.
Ini tidak hanya berlaku untuk customer kami, tetapi juga untuk Google. TPU telah lama menjadi basis untuk melatih dan melayani produk bertenaga AI seperti YouTube, Gmail, Google Maps, Google Play, dan Android. Faktanya, Gemini dilatih dan dilayani menggunakan TPU.
Minggu lalu, kami mengumumkan Cloud TPU v5p, akselerator AI kami yang paling kuat, skalabel, dan fleksibel hingga saat ini. TPU v5p bisa empat kali lipat lebih skalabel daripada TPU v4 dalam hal total FLOP yang tersedia per pod. Sebelumnya tahun ini, kami mengumumkan ketersediaan umum Cloud TPU v5e. Dengan peningkatan performa inferensi per dolar sebesar 2,7 kali lipat dalam benchmark industri dibandingkan dengan TPU v4 generasi sebelumnya, ini adalah TPU kami yang paling hemat biaya hingga saat ini.
Kami juga mengumumkan AI Hypercomputer, terobosan arsitektur superkomputer yang menggunakan sistem terintegrasi dari perangkat keras yang dioptimalkan untuk performa, perangkat lunak terbuka, kerangka kerja ML terkemuka, dan model konsumsi yang fleksibel. AI Hypercomputer memiliki berbagai pilihan akselerator, termasuk beberapa kelas TPU generasi ke-5 dan GPU NVIDIA.
Menyediakan model terobosan terbaru
Gemini juga merupakan model kami yang paling fleksibel — dapat berjalan secara efisien di semua perangkat, mulai dari pusat data hingga perangkat seluler. Gemini Ultra adalah model kami yang terbesar dan paling canggih untuk tugas-tugas yang sangat kompleks, sementara Gemini Pro adalah model terbaik kami untuk skala besar di berbagai tugas, dan Gemini Nano adalah model kami yang paling efisien untuk tugas on-device. Kemampuan mutakhirnya akan secara signifikan meningkatkan cara developer dan customer perusahaan membangun dan menskalakan dengan AI.
Hari ini, kami juga memperkenalkan versi terbaru dari model gambar, Imagen 2, teknologi text-to-image tercanggih dari kami. Versi terbaru ini menghadirkan peningkatan kemampuan fotorealisme, text rendering, dan pembuatan logo sehingga Anda dapat dengan mudah membuat gambar dengan hamparan teks dan menghasilkan logo.
Selain itu, berdasarkan upaya kami seputar model khusus domain dengan Med-PaLM, kami dengan gembira mengumumkan MedLM, rangkaian model dasar yang disesuaikan untuk kasus penggunaan industri perawatan kesehatan. MedLM tersedia untuk mengizinkan customer di Vertex AI, memberikan customer kekuatan model dasar Google yang disesuaikan dengan keahlian medis.
Meningkatkan kinerja platform Vertex AI dengan Gemini
Hari ini, kami mengumumkan bahwa Gemini Pro kini tersedia dalam pratinjau di Vertex AI. Hal ini memberdayakan developer untuk membangun agen baru dan berbeda yang dapat memproses informasi melalui teks, kode, gambar, dan video saat ini. Vertex AI membantu Anda menerapkan dan mengelola agen hingga produksi, secara otomatis mengevaluasi kualitas dan kepercayaan respons agen, serta memantau dan mengelolanya.
Vertex AI memberi Anda dukungan komprehensif untuk Gemini, dengan kemampuan untuk menemukan, menyesuaikan, menambah, mengelola, dan menerapkan agen yang dibangun berdasarkan API Gemini, termasuk:
Berbagai cara untuk menyesuaikan agen yang dibangun dengan Gemini menggunakan data Anda sendiri, termasuk rekayasa cepat, penyesuaian berbasis adaptor seperti Adaptasi Tingkat Rendah (LoRA), pembelajaran penguatan dari umpan balik manusia (RLHF), dan distilasi.
Alat augmentasi yang memungkinkan agen menggunakan penyematan untuk mengambil, memahami, dan bertindak berdasarkan informasi dunia nyata dengan blok penyusun pengambilan augmented generasi (RAG) yang dapat dikonfigurasi. Vertex AI juga menawarkan ekstensi untuk mengambil tindakan atas nama pengguna di aplikasi pihak ketiga.
Landasan untuk meningkatkan kualitas respons dari Gemini dan model AI lainnya dengan membandingkan hasil terhadap sumber data web dan perusahaan berkualitas tinggi.
Serangkaian kontrol luas yang membantu Anda tetap aman dan bertanggung jawab saat menggunakan model AI generatif, termasuk Gemini.
Selain dukungan Gemini pada Vertex AI, hari ini kami juga mengumumkan:
Automatic Side by Side (Auto SxS), alat otomatis untuk membandingkan model. Auto SxS lebih cepat dan hemat biaya dibandingkan evaluasi model manual, serta dapat disesuaikan di berbagai spesifikasi tugas untuk menangani kasus penggunaan AI generatif baru.
Penambahan Mistral, ImageBind, dan DITO ke dalam Model Garden Vertex AI, melanjutkan komitmen kami terhadap ekosistem model terbuka.
Kami akan segera menghadirkan Gemini Pro ke Vertex AI Search and Conversation untuk membantu Anda membuat aplikasi tingkat produksi yang menarik dengan cepat.
Memperluas kemampuan Duet AI
Dengan Duet AI, kami berkomitmen untuk membantu customer kami meningkatkan produktivitas, memperoleh keunggulan kompetitif, dan pada akhirnya meningkatkan keuntungan mereka. Saat ini, Duet AI for Developers dan Duet AI in Security Operations telah tersedia secara umum, dan kami akan menggabungkan Gemini ke dalam portofolio Duet AI kami selama beberapa minggu ke depan.
Duet AI for Developers membantu pengguna membuat kode lebih cepat dengan penyelesaian kode AI, pembuatan kode, dan obrolan di beberapa lingkungan pengembangan terintegrasi (IDE). Ini menyederhanakan tugas developer akan dan proses yang berulang dengan pintasan untuk tugas-tugas umum, termasuk pembuatan pengujian unit dan penjelasan kode, mempercepat pemecahan masalah dan remediasi masalah, dan membantu mengurangi peralihan konteks. Duet AI juga mempercepat pembelajaran berbasis keterampilan dengan memberikan pengguna kemampuan untuk mengajukan pertanyaan menggunakan obrolan bahasa alami.
Hari ini, kami juga mengumumkan bahwa lebih dari 25 mitra bantuan kode dan basis pengetahuan akan menyumbangkan kumpulan data khusus untuk platform mereka, sehingga pengguna Duet AI for Developers dapat menerima bantuan AI berdasarkan pengkodean dan model data mitra, dokumentasi produk, praktik terbaik, dan sumber daya perusahaan berguna lainnya.
Duet AI in Security Operations, platform operasi keamanan terpadu Google Cloud, dapat memungkinkan para pembela HAM melindungi organisasi mereka dari serangan cyber dengan lebih efektif. Tim keamanan dapat meningkatkan keterampilan mereka dan membantu mempercepat deteksi, investigasi, dan respons ancaman menggunakan kekuatan AI generatif. Dengan Duet AI in Security Operations, kami menawarkan bantuan AI pertama di Chronicle, di mana pengguna dapat mencari data dalam jumlah besar dalam hitungan detik dengan kueri khusus yang dihasilkan dari bahasa alami, mengurangi peninjauan manual yang memakan waktu, dengan cepat menampilkan konteks penting dengan memanfaatkan ringkasan otomatis dari data kasus dan peringatan, serta meningkatkan waktu respons menggunakan rekomendasi untuk langkah selanjutnya guna mendukung remediasi insiden.
Google memiliki seluruh rangkaian teknologi Duet AI, mulai dari infrastruktur dan model fondasi, hingga integrasi tingkat atas dan pengalaman pengguna. Kami bangga bahwa para insinyur dan peneliti kami berkolaborasi secara unik untuk menghadirkan terobosan teknologi AI terbaru kami kepada customer dengan pengalaman produk yang konsisten dan terpadu. Awal tahun depan, kami berencana memperluas Duet AI di seluruh portofolio kami, termasuk Duet AI di BigQuery, Looker, produk database kami, Apigee, dan banyak lagi.
Mendorong generasi berikutnya dari solusi AI
Selain kemampuan baru ini di seluruh jajaran teknologi AI terintegrasi vertikal kami, kami memiliki harga kompetitif yang membuat Gemini dapat diakses oleh lebih banyak organisasi, dan memperluas kebijakan pertanggungan kami untuk membantu melindungi Anda dari masalah hak cipta.
Peluncuran Gemini, dikombinasikan dengan portofolio infrastruktur AI kami yang sangat skalabel, Vertex AI, dan Duet AI, menawarkan cloud yang komprehensif dan kuat untuk developer dan customer. Dengan inovasi ini, Google Cloud mendorong generasi berikutnya agen berbasis AI di setiap industri, memberdayakan organisasi untuk membangun, menggunakan, dan berhasil mengadopsi AI generatif selanjutnya untuk mendorong transformasi digital mereka.