Bruno Menezes e Daniel de Senna
Duração: 2h30 (2 dias) Datas e horários:
- 09/02/2026 – 11:00–12:30
- 10/02/2026 – 13:30–15:00
- 11/02/2026 – 15:00–16:30 (Sobre Agentes com o professor Eduardo Bezerra)
Apresentar, de forma concisa e aplicada, os fundamentos conceituais e práticos dos Large Language Models (LLMs), destacando a evolução dos Transformers e as inovações recentes em inferência e ajuste fino.
O minicurso oferece uma visão atualizada do ecossistema de modelos abertos (LLaMA 3, Qwen2, Mixtral, DeepSeek, entre outros), equilibrando base teórica essencial e demonstrações práticas de geração e fine-tuning, com foco em eficiência, alinhamento e aplicações científicas.
- Introdução aos LLMs: panorama 2023–2025, evolução, impacto e ecossistema open-source
- Núcleo do Transformer: atenção, embeddings e normalização, com compreensão conceitual e sem excesso matemático
- Variações modernas: Mixture of Experts (MoE), Rotary Embeddings e Attention Scaling, com visão sintética e aplicada
- Controle e inferência: parâmetros de geração (temperatura, top-p) e gerenciamento de contexto (KV cache, expected-attention, cache merging)
-
Experimentação guiada com prompts e parâmetros de geração
-
Exploração de variação de temperatura, top-p e raciocínio via chain-of-thought
-
Prompt engineering e in-context learning: few-shot, self-consistency e limites de contexto
-
Pré-treinamento e otimização: datasets em larga escala, quantização (FP8, INT4) e eficiência computacional
-
Ajuste fino supervisionado (SFT) e métodos eficientes: LoRA 2, QLoRA e estratégias em três estágios para fine-tuning de modelos quantizados
-
Demonstração simplificada de pipeline LoRA/QLoRA
-
Seleção de camadas e visualização de pesos adaptados
-
Alinhamento de preferências: DPO, RLHF, GRPO e abordagens emergentes de raciocínio (DeepSeek-R1, raciocínio via RL)
-
Avaliação moderna (2024–2025): MMLU-Pro/Pro+, AIME-24/25, LiveBench e GPQA
-
Riscos de contaminação e limitações do paradigma LLM-as-a-judge
-
Tendências e desafios em LLMs abertos: interoperabilidade, governança e impacto científico
Livro SBC: https://books-sol.sbc.org.br/index.php/sbc/catalog/book/179
-
Yang, A. et al. Qwen2 Technical Report. arXiv:2407.10671 (2024). https://arxiv.org/abs/2407.10671
-
Wang, P. et al. Qwen2-VL: Enhancing Vision-Language Model's Perception of the World at Any Resolution. arXiv:2409.12191 (2025). https://arxiv.org/abs/2409.12191
-
Jiang, A. Q. et al. Mixtral of Experts. arXiv:2401.04088 (2024). https://arxiv.org/abs/2401.04088
-
Zhang, Y. et al. DeepSeek-Coder-V2: Breaking the Barrier of Closed-Source Models in Code Intelligence. arXiv:2406.11931 (2024).
https://arxiv.org/abs/2406.11931 -
Touvron, H. et al. LLaMA: Open and Efficient Foundation Language Models Meta AI Technical Report, arXiv:2302.13971 (2023). https://arxiv.org/abs/2302.13971
-
Mroueh, Y. et al. Revisiting Group Relative Policy Optimization. arXiv:2505.22257v1 (2025). https://arxiv.org/abs/2505.22257
-
Zhou, C. et al. Efficient Fine-Tuning of Quantized LLMs via Three-Stage Optimization. ICLR 2025 submission. https://openreview.net/forum?id=zcx6rIMbbR
-
Dettmers, T. et al. QLoRA: Efficient Finetuning of Quantized LLMs. NeurIPS (2023). https://arxiv.org/abs/2305.14314
-
Ouyang, L. et al. Training Language Models to Follow Instructions with Human Feedback. OpenAI, NeurIPS (2022). https://arxiv.org/abs/2203.02155

