Какие вопросы задают на собеседовании в Точка Банк (ml, middle_plus)?

Question

Маяк · Accepted Answer

1. Какие типы данных вообще есть в Python?
2. Зачем нам вообще изменяемые данные и зачем неизменяемые? Зачем иметь и tuple, и list?
3. Может ли список быть ключом в словаре?
4. Зачем ключу словаря быть hashable?
5. Что произойдёт, если добавить списку метод __hash__ (например, возвращающий return 1) и сделать такой список ключом в словаре?
6. Какие коллизии будут возникать в хэш-таблице и как они обрабатываются?
7. Какая сложность доступа по ключу в словаре?
8. Как изменится сложность доступа по ключу, если все ключи словаря будут списками с одинаковым хэшем (упадут в один бакет)?
9. Приходилось ли распараллеливать работу? Как в целом можно распараллелить вычисления в Python?
10. Чем отличается мультипоточность от мультипроцессорности?
11. Ускорит ли меня обучение RandomForest на 100 потоках на одноядерном компьютере?
12. В каком случае потоки могут ускорить выполнение? Чем отличаются IO-bound и CPU-bound операции в контексте GIL?
13. Какие джойны существуют в SQL?
14. Что такое cross join?
15. Что будет, если в inner join вместо условия связи написать 1=1? Можно ли так писать?
16. Есть одна таблица с двумя строками, другая с тремя строками. Делаешь join. Какое минимальное и максимальное количество строк может получиться?
17. Что получится на выходе, если сделать left join двух таблиц по столбцу, в котором в обеих таблицах стоят NULL?
18. Пишешь ли оконные функции? Что можно писать в скобках после OVER (например в sum(value) over(...))?
19. Что регулирует размещение окна в оконных функциях (rows between / range between) и как, например, посчитать сумму за предыдущие три строки?
20. Что такое ROC AUC? Расскажи про эту метрику.
21. Что ты имел в виду, когда сказал, что ROC AUC — ранжирующая метрика?
22. Как изменится ROC AUC, если округлить предсказания до какого-нибудь знака после запятой? В какую сторону и почему?
23. Какие метрики регрессии ты знаешь?
24. На что бы ты опирался при выборе метрики между MAE и MSE?
25. Что значит «обрабатывать выбросы» применительно к метрике? Раскрой мысль подробнее.
26. Что такое метрика R² (доля объяснённой дисперсии)?
27. В чём разница между MAPE и SMAPE? Что стоит в знаменателе MAPE и почему SMAPE симметричная?
28. Зачем используют F1 меру? Что за операцию делают с precision и recall (почему среднее гармоническое, а не обычное среднее)?
29. Верно ли, что среднее гармоническое всегда меньше среднего арифметического?
30. С какими моделями для табличных данных ты работал?
31. Согласен ли ты с утверждением, что бустинги на табличных данных бьют все остальные классические модели? Почему да/нет?
32. В каких случаях стоит учить линейную модель вместо бустинга?
33. Если предсказывать значение с линейно-возрастающим трендом (например количество денег с учётом инфляции), как будут работать бустинги и деревянные алгоритмы за пределами диапазона обучающей выборки?
34. Если в обучающей выборке таргет всегда положительный, может ли RandomForest предсказать отрицательное значение на тестовой выборке?
35. А может ли бустинг предсказать значение за пределами диапазона таргета? Что предсказывает, например, десятое дерево в ансамбле бустинга?
36. Расскажи верхнеуровнево, как устроен трансформер.
37. Расскажи про механизм attention.
38. Как attention работает внутри (query, key, value, перемножение матриц)?
39. Зачем при вычислении attention делить на корень из размерности эмбеддингов?
40. Как масштабирование влияет на softmax? Чем будет различаться выход softmax от входа [10, 100] и от входа [1, 10]?
41. Что ещё есть в блоке энкодера, кроме attention (add & norm, полносвязка, layer norm)?
42. Зачем нужен skip connection?
43. Как в трансформерах учитываются позиции слов (позиционные эмбеддинги)?
44. Какие ещё бывают подходы к позиционным эмбеддингам (нумерация, относительные, T5 relative, RoPE)?
45. Что такое BERT и как его обучают (MLM, NSP)?
46. Приведи пример, когда имеет смысл обучить свой токенайзер и заменить стандартный.
47. Если ты увеличиваешь размер батча при обучении нейросети, что логичнее сделать с learning rate — увеличить или уменьшить, и почему?
48. Какие ты знаешь способы для ускорения инференса нейронных сетей?
49. Что такое квантизация?
50. Как бы ты решал задачу классификации настроения комментариев клиентов (sentiment analysis) при наличии разметки? Опиши последовательность действий.