LLM Engineer

1 settimana fa


Milano, Lombardia, Italia WeHunt A tempo pieno


Stiamo cercando un/a LLM Engineer
con esperienza nello sviluppo di applicazioni basate su modelli linguistici di grandi dimensioni (LLM), con un focus particolare su motori di ricerca semantici, RAG (retrieval-augmented generation) e integrazione con modelli come Gemini, GPT, Claude o simili.

La ricerca è per
una startup tecnologica innovativa
, attiva nel settore
digital platform & e-commerce esperienziale
, che integra soluzioni online e strumenti collaborativi per creare nuove modalità di interazione e fruizione dei servizi digitali.

Il tuo obiettivo sarà progettare, ottimizzare e mantenere componenti chiave del nostro motore di ricerca AI-driven, collaborando a stretto contatto con sviluppatori, product manager e altri team tecnici.

Responsabilità:

  • Progettare e implementare pipeline LLM-based per la ricerca semantica e il question answering.
  • Integrare e orchestrare modelli via API (Gemini, OpenAI, Azure, Hugging Face, etc.).
  • Lavorare con tecniche di embedding, retrieval, prompt engineering, RAG e memory.
  • Ottimizzare performance, latenza e costi delle chiamate LLM.
  • Collaborare con i team di prodotto per adattare la tecnologia a use case reali.
  • Monitorare nuove release di modelli e strumenti LLM per mantenere il sistema all'avanguardia.

Competenze Tecniche:

  • Esperienza concreta nello sviluppo di applicazioni basate su LLM (es. GPT, Claude, Gemini, Mistral).
  • Ottima conoscenza di Python (e.g. LangChain, LlamaIndex, Transformers, FastAPI).
  • Conoscenza di concetti come: semantic search, FAISS / Weaviate / Pinecone, embedding models, prompt tuning, RAG.
  • Esperienza con REST API / GraphQL / Web services.

More Info:

  • RAL:
    molto competitiva, commisurata all'esperienza del candidato
  • Modalità di lavoro ibrida:
    3 giorni in ufficio; 2 giorni smart working (sede Milano)

  • AI Engineer

    1 settimana fa


    Milano, Lombardia, Italia Power AI A tempo pieno

    Chi siamo:Fondata da ex-Microsoft, ex-AWS e da esperti del mondo assicurativo, PowerAI è una start-up insurtech in rapida crescita che sviluppa prodotti AI specifici per il settore assicurativo. Visita per saperne di più.Cerchiamo un AI Engineer:→ con 2-3 anni di esperienza nello sviluppo applicazioni in Python in ambienti Cloud (es. Azure e AWS)→ che...

  • AI Engineer

    4 giorni fa


    Milano, Lombardia, Italia Power AI A tempo pieno

    Chi siamo:Fondata da ex-Microsoft, ex-AWS e da esperti del mondo assicurativo, PowerAI è una start-up insurtech in rapida crescita che sviluppa prodotti AI specifici per il settore assicurativo. Visita per saperne di più.Cerchiamo un AI Engineer:→ con 2-3 anni di esperienza nello sviluppo applicazioni in Python in ambienti Cloud (es. Azure e AWS)→ che...


  • Milano, Lombardia, Italia Kong Inc. A tempo pieno 60.000 € - 120.000 € all'ano

    Are you ready to power the World's connections?If you don't think you meet all of the criteria below but are still interested in the job, please apply. Nobody checks every box - we're looking for candidates that are particularly strong in a few areas, and have some interest and capabilities in others.About The RoleYou will join the engineering team that...


  • Milano, Lombardia, Italia TROPICO Security A tempo pieno

    Important, read below before applying AI/ML Engineer @ Tropico SecurityAt Tropico, we're rewriting how cyber defense works. We build AI-powered decoys that lure attackers and reveal threats before damage happens, think digital traps that fight back.We're looking for an AI/ML Engineer with exceptional Python skills (LeetCode hard = easy for you), strong LLM...


  • Milano, Lombardia, Italia Kong Inc. A tempo pieno 60.000 € - 120.000 € all'ano

    Are you ready to power the World's connections?If you don't think you meet all of the criteria below but are still interested in the job, please apply. Nobody checks every box - we're looking for candidates that are particularly strong in a few areas, and have some interest and capabilities in others.Are you ready to power the World's connections?If you...


  • Milano, Lombardia, Italia Kong Inc. A tempo pieno 60.000 € - 120.000 € all'ano

    Are you ready to power the World's connections?If you don't think you meet all of the criteria below but are still interested in the job, please apply. Nobody checks every box - we're looking for candidates that are particularly strong in a few areas, and have some interest and capabilities in others.About The RoleYou will join the engineering team that...


  • Milano, Lombardia, Italia Kong A tempo pieno 85.000 € - 130.000 € all'ano

    Are you ready to power the World's connections?If you don't think you meet all of the criteria below but are still interested in the job, please apply. Nobody checks every box - we're looking for candidates that are particularly strong in a few areas, and have some interest and capabilities in others.Are you ready to power the World's connections?If you...


  • Milano, Lombardia, Italia Huware A tempo pieno 60.000 € - 80.000 € all'ano

    Who we are?Huware is acloud consulting companywith 20 years of experience at the forefront of digital transformation for businesses. As a premier partner of Google Cloud, Google Workspace, Salesforce, LumApps, AODocs, and , we build solutions powered by the latest cloud, data, and AI technologies. Our mission is to guide organizations through change, putting...


  • Milano, Lombardia, Italia Stealth AI Startup A tempo pieno

    Senior Machine Learning Engineer (Document Intelligence, Agentic AI & Operational Finance)Location:Italy (hybrid) ·Employment:Full-time ·Seniority:Mid/SeniorAbout the client (confidential)Our client is a fast-growing enterprise SaaS company serving Italy'sfield-servicesecosystem with an operational platform spanning sites, finance, and administration,...


  • Milano, Lombardia, Italia BIP Group A tempo pieno 40.000 € - 60.000 € all'ano

    DescriptionJunior AI Engineer for Martech  La tua sfida Datwave è la società del gruppo Bip focalizzata su tecnologie Google Cloud Platform (GCP), spin-off di Bip xTech nata per offrire soluzioni avanzate di AI, Cloud, Data Analytics e Martech. Operiamo con un team altamente specializzato per aiutare le aziende a sfruttare il valore dei dati e...