V přednášce se Marek Šimůnek podělí o zkušenosti z provozu inferencí. Jak automaticky škálují modely podle aktuálního provozu a na to, jak garantují jejich aplikacím požadovaný traffic. Probereme využití dávkového (batchové) zpracování pro vyšší utilizaci během nižších špiček a představeny budou metriky, které v Seznamu sledují pro optimalizaci výkonu.