Pada akhir Desember 2024, Latent.Space merilis “The 2025 AI Engineer Reading List”, sebuah kurasi ~50 makalah, model, dan blog dari 10 topik utama AI.
Setiap bacaan dipilih karena relevansi praktis untuk para AI engineer, dengan target satu bacaan per minggu selama setahun .

1. Frontier LLMs
Fokus pada arsitektur dan kemampuan model besar seperti GPT (GPT‑4.5+), Claude 3.5, Gemini 2.0, LLaMA 1‑3, Mistral, Mixtral, Pixtral, serta inovasi dari DeepSeek dan model MoE.
Termasuk studi perbandingan dan adaptasi model terbuka untuk keperluan industri .
2. Benchmarks & Evals
Makalah kunci: MMLU, GPQA, BIG-Bench, FrontierMath, ARC AGI challenge, serta MuSR dan LongBench untuk konteks panjang.
Membantu memahami kemampuan matematis & logika LLM dalam skala nyata .
3. Prompting, ICL & Chain of Thought
Meliputi teknik seperti few-shot, Chain‑of‑Thought, Tree of Thought, Prompt Tuning, dan Automated Prompt Engineering.
Ditambah panduan praktis oleh Lilian Weng, Eugene Yan, dan materi workshop dari Anthropic .
4. Retrieval-Augmented Generation (RAG
Inti: memahami IR tradisional (BM25, FAISS, HNSW), ditambah makalah RAG awal, MTEB benchmark, GraphRAG, RAGAS.
Pedoman praktis via framework seperti LlamaIndex & LangChain, serta diskusi RAG vs long context .
5. Agents
Fokus pada evaluasi SWE‑Bench dan implementasi agen multimodal.
Agen dianggap bukan sekadar tren tetapi arsitektur wajib di banyak aplikasi modern.
6. Code Generation
(Tidak dirinci dalam sumber, namun termasuk dalam daftar 10 topik utama.)
7. Vision
8. Voice
9. Image/Video Diffusion
10. Finetuning
Semua mencakup makalah teratas di masing‑masing sub-bidang, dengan fokus pada aplikasi nyata—mulai dari deteksi objek, pemrosesan suara, hingga model difusi dan teknik fine‑tuning efisien .
🛠️ Mengapa Ini Penting?
Praktis dan Ringkas: Dirancang untuk AI engineer sibuk—langsung ke inti, tanpa teori dasar yang berulang.
Luat dan Terkini: Meliputi tren terbaru tahun 2025, termasuk emergensi agen dan peningkatan RAG .
Arah Pengembangan: Menyoroti pergeseran fokus dari deploy/infrastruktur ke evaluasi kualitas, filosofi AI, dan peran agen sebagai norma .
Sumber Artikel: https://www.latent.space/p/2025-papers