FrontierScience adalah tes baru dari OpenAI untuk melihat kemampuan AI dalam sains. Tes ini bukan tipe soal yang jawabannya bisa ditebak dari hafalan. Tujuannya jelas. Mengukur apakah AI bisa berpikir dan memecahkan masalah sains seperti orang yang benar benar paham materi.

Tesnya fokus ke tiga bidang utama. Fisika, kimia, dan biologi. OpenAI membaginya jadi dua bagian besar. Bagian pertama isinya soal soal sulit seperti level olimpiade. Totalnya 100 soal dan jawabannya harus singkat. Bagian kedua lebih mirip tugas riset. Ada 60 tugas kecil yang menilai apakah AI bisa menganalisis, membuat langkah kerja yang masuk akal, dan menarik kesimpulan dengan benar.

Cara nilainya juga dibuat ketat. Untuk tugas riset, setiap jawaban dinilai pakai skor 1 sampai 10 berdasarkan rubrik. Supaya dianggap “lulus”, nilainya harus minimal 7. OpenAI juga bilang sebagian set soal dibuka untuk umum, tapi tidak semuanya, supaya tes ini tidak cepat bocor ke data latihan model.

Eksplorasi konten lain dari Insimen

Berlangganan untuk dapatkan pos terbaru lewat email.

Tags:

AI Benchmark OpenAI Riset

OpenAI Rilis FrontierScience Untuk Menguji Seberapa Jago AI Di Sains

Eksplorasi konten lain dari Insimen

Tags:

Insimen Teknologi

Berita Populer

Previous PostAmazon Dekati OpenAI Dengan Cek Raksasa US$10 Miliar

Next PostChatGPT Images Naik Kelas Dengan Edit Presisi Dan Generasi Lebih Ngebut

Leave a Reply Cancel Reply

Dipercaya oleh

perusahaan multinasional startup inovatif pemimpin industri umkm kreatif

Jelajah Cepat

OpenAI Rilis FrontierScience Untuk Menguji Seberapa Jago AI Di Sains

Eksplorasi konten lain dari Insimen

Tags:

Insimen Teknologi

Berita Populer

Previous PostAmazon Dekati OpenAI Dengan Cek Raksasa US$10 Miliar

Next PostChatGPT Images Naik Kelas Dengan Edit Presisi Dan Generasi Lebih Ngebut

Recommended For You

Google Memperluas Akses Gemini 3.1 Pro Untuk Tugas Kompleks

Amanda Askell Membentuk Moral Claude Di Anthropic

Google Mengungkap Pendapatan YouTube 2025 Tembus 60 Miliar Dolar

Leave a Reply Cancel Reply

Dipercaya oleh

perusahaan multinasional startup inovatif pemimpin industri umkm kreatif

Eksplorasi konten lain dari Insimen