DeepSeek-V3.2
DeepSeek-V3.2 (via) Dois novos modelos de peso aberto (licenciados pelo MIT) da DeepSeek hoje: DeepSeek-V3.2 e DeepSeek-V3.2-Speciale, ambos com parâmetros de 690 GB e 685B. Aqui está o relatório técnico em PDF.
DeepSeek-V3.2 é o novo modelo carro-chefe do DeepSeek, agora em execução em chat.deepseek.com.
A diferença entre os dois novos modelos é melhor explicada por este parágrafo do relatório técnico:
DeepSeek-V3.2 integra dados de raciocínio, agente e alinhamento humano extraídos de especialistas, passando por milhares de etapas de treinamento contínuo de RL para chegar aos pontos de verificação finais. Para investigar o potencial do pensamento estendido, também desenvolvemos uma variante experimental, DeepSeek-V3.2-Speciale. Este modelo foi treinado exclusivamente em dados de raciocínio com penalidade de comprimento reduzida durante RL. Além disso, incorporamos o conjunto de dados e o método de recompensa do DeepSeekMath-V2 (Shao et al., 2025) para aprimorar os recursos em provas matemáticas.
Abordei DeepSeek-Math-V2 na semana passada. Assim como esse modelo, DeepSeek-V3.2-Speciale também ganha ouro na Olimpíada Internacional de Matemática de 2025, tão querida pelas equipes de treinamento de modelos!
Experimentei os dois modelos em “Gerar um SVG de um pelicano andando de bicicleta” usando o recurso de bate-papo do OpenRouter. DeepSeek V3.2 produziu esta cadeia de raciocínio muito curta:
Vamos supor o seguinte:
Raio da roda: 40
Distância entre os centros das rodas: 180
Altura do assento: 60 (acima do centro da roda traseira)
Guiador: acima da roda dianteira, estendendo-se para trás e para cima.Definiremos a origem no centro da roda traseira.
Criaremos o SVG com uma viewBox que caiba em todo o desenho.
Vamos começar configurando o SVG.
Seguido por esta ilustração:

Aqui está o que obtive do modelo Speciale, que pensou profundamente sobre a geometria de bicicletas e pelicanos por muito tempo (pelo menos 10 minutos) antes de cuspir este resultado:

