10 preguntes més freqüents sobre les entrevistes de científics de dades

El camp de la ciència de dades està en constant evolució, abastant diverses indústries i requereix una àmplia competència que inclou matemàtiques, estadístiques, programació i màrqueting. Com a tal, convertir-se en científic de dades requereix una barreja impressionant d’habilitat tècnica, creativitat i comunicació.

Les descripcions de llocs de treball dels científics poden variar molt, tot i que tots busquen candidats amb una llarga llista de les habilitats laborals més desitjables com ara pensament crític, resolució de problemes, analítica de dades, intel·ligència emocional, atenció al detall i treball en equip. Això significa que les preguntes d’entrevistes per a científics de dades poden abastar diversos temes i anar des de consultes típiques d’habilitats suaus fins a debats extremadament tècnics.

Les entrevistes a ciències de dades requereixen molta preparació. Tant si esteu fora d’una escola de ciències d’informàtica superior com si voleu traslladar-vos a una empresa o indústria diferent, haureu de passar temps per superar els conceptes principals del vostre treball. De la mateixa manera que sabeu conduir però podríeu tenir problemes per recitar regles específiques del camí, podríeu quedar bloquejat en una entrevista intentant articular com funciona un algorisme específic.

Per ajudar-vos a preparar-vos, hem recopilat 10 de les preguntes més habituals de les entrevistes a científics de dades. Des de projeccions primerenques fins a vídeo de segona i tercera etapa i entrevistes in situ, trobareu una gran varietat d’exàmens com aquests de les vostres habilitats tècniques, habilitats de comunicació i estil de treball.

1. "Expliqueu-nos més informació sobre el projecte més recent de la vostra cartera".

Els científics de dades tenen una demanda en moltes indústries diferents, però les empreses solen buscar algú amb competències molt específiques, així com una bona cultura. Una cartera en línia detallada que mostra el tipus de treball de què ets capaç, així com una forta presència en mitjans de comunicació social i una marca personal, t’ajuda a distingir-te d’altres candidats, així com a connectar-te amb contractació de directius i reclutadors per a llocs de treball perfectes. adequat per.

Estigueu preparats en qualsevol entrevista de ciències de dades per parlar de tots els elements del vostre CV, cartera o lloc web. Personalitza la teva resposta sobre un projecte que s’adapti a la teva audiència. Si es tracta d’un cribratge inicial o d’un plafó amb participants de diversos departaments, l’atenció ha de centrar-se en la forma en què el treball ha creat resultats positius per al client i el seu negoci.

Quan arribeu a la part del procés d’entrevistes on us trobeu amb un altre científic de dades, enginyer, analista o una altra persona tècnica, cal descripció més detallada de les dades i processos implicats en el vostre treball.

2. "Per què voleu treballar per a aquesta empresa?"

Tot i que se us hagi contactat directament a través de la vostra cartera en línia o del vostre perfil de LinkedIn i se us convidés a entrevistar-se per obtenir un lloc obert, l’empresa encara voldrà saber per què heu acceptat i per què creieu que serà una bona adaptació per a la feina.

A banda de millorar les teves habilitats tècniques, la vostra preparació per a l'entrevista hauria d'incloure investigacions sobre el negoci al qual sol·licites. La informació sobre la seva indústria, missió, personal, exactament el que fan i el bé que ho fan, us ajudaran a respondre una resposta específica a aquesta pregunta.

Indiqueu com la vostra competència els ajudarà a assolir els seus objectius. Cerqueu una manera d’expressar la passió per un o diversos aspectes del vostre rol laboral, inclosos la missió, la filosofia, la innovació o la línia de productes de l’empresa. Si aquest és el vostre treball de somni, pot valer la pena el temps d’elaborar un projecte de ciències de dades abans de l’entrevista que solucioni un problema per ells, com apel·lar a una nova demografia o programar els lliuraments de manera més eficient.

3. 'Poseu un nom als científics que més admireu i expliqueu per què.'

Tot i que es tracta d’una pregunta molt personal que no té tècnicament una resposta correcta, les respostes que seleccioneu són molt importants. La vostra investigació sobre l'empresa, així com les del quadre de l'entrevista, us poden ajudar a deixar una bona primera impressió només amb aquesta pregunta.

Conèixer les persones que són destacades al camp, així com les que fan onades actualment, demostrarà als entrevistadors que sou coneixedors i apassionats de la indústria. És útil parlar de científics de dades valorats en l’àmbit professional específic que sol·liciteu, com ara finances, medicaments o borses.

Aquesta pregunta no és més que una llista impressionant de noms. La part “per què” de l’equació també mostrarà als vostres empresaris potencials què valoreu al vostre camp i com us acostareu a la vostra feina. Si la vostra investigació ha demostrat que l'empresa valora la innovació, la integritat o fins i tot un determinat mètode estadístic, aquesta és una gran oportunitat per fer-los saber que compartiu aquests mateixos valors.

4. "Com explicaries un motor de recomanació a algú del departament de Màrqueting?"

Una de les qualitats importants que diferencien els científics de dades d’altres genis tècnics és la capacitat de convertir, mostrar i explicar dades de manera que les persones no tècniques puguin entendre. Això fa que una consulta com aquesta sigui una de les preguntes més importants de les entrevistes a científics de dades. Els entrevistadors volen veure el bé que podeu comunicar conceptes com ara modelatge de dades, arbres de decisió i regressió lineal a qualsevol audiència.

En aquest cas concret, primer voldreu explicar en termes senzills com funciona un motor de recomanacions, amb exemples tant de filtratge basat en contingut com de filtratge col·laboratiu. Aleshores, voldreu discutir com podeu treballar amb el departament de màrqueting per combinar les seves habilitats d’atractar als clients amb la potència de l’algoritme que utilitza dades recopilades per ajudar a identificar el que desitgen els consumidors.

5. "Quines diferències hi ha entre l'aprenentatge supervisat i el no tutelat?"

Podeu començar resumint que la diferència principal entre aquests dos és que l’aprenentatge supervisat té dades de formació que l’algoritme pot aprendre i proporcionar respostes. L’aprenentatge no vigilat requereix agrupar les coses per similituds, anomalies comunes i altres processos de cerca de patrons en lloc de dades dures i ràpides.

L’entrevistador voldrà que aprofundeixi amb més detall, per la qual cosa és important enumerar les diferències específiques i poder parlar sobre els diversos algoritmes utilitzats.

Aprenentatge supervisat

  • utilitza com a entrada dades conegudes i etiquetades
  • té un mecanisme de retroalimentació
  • usat per predir
  • els seus algorismes comuns inclouen l’arbre de decisions, la regressió logística, la regressió lineal, la màquina vectorial de suport i el bosc aleatori

Aprenentatge no vigilat

  • utilitza dades d’entrada no etiquetades
  • no té cap mecanisme de retroalimentació
  • utilitzat per a anàlisi
  • els seus algorismes comuns inclouen el clúster de K-means, l’agrupament jeràrquic, els codificadors automàtics i les regles d’associació

Voldreu tenir alguns exemples, genèrics o d’un projecte específic en què heu treballat, per il·lustrar les diferències entre aquests dos tipus d’aprenentatge automàtic i en quins casos es poden utilitzar cadascun. Per exemple, es pot utilitzar un aprenentatge no supervisat quan es llança un nou producte on es desconeix la demografia del client que pugui atreure.

Subscriu-te

Inscriviu-vos a la nostra newsletter per obtenir contingut més fantàstic i obtenir un 20% de descompte en la nostra prova professional

Subscriu-te

6. "Com s'evita el biaix de selecció?"

Aquesta pregunta pot adoptar moltes formes en una entrevista de ciències de dades. Pot ser que us demani que definiu el biaix de selecció, com evitar-ho o com podeu donar un exemple específic de com va tenir un paper en un projecte en què vau treballar.

El principal problema amb el biaix de selecció és que s’han extret conclusions a partir d’una mostra no aleatòria. Evidentment, la solució més fàcil és seleccionar sempre entre una mostra aleatòria d’una població clarament definida. Haureu d’explicar per què això no sempre és possible.

Tingueu en compte que, ja que el biaix de selecció pot ser intencionat –amb la selecció de temes o l’eliminació de dades realitzats de manera intencionada per demostrar una teoria o projecció preconcebudes–, aquesta podria ser una manera indirecta que el grup de contractació pugui fer una de les dures preguntes d’entrevista sobre l’ètica i la integritat en el treball. .

En última instància, voldreu subratllar com el biaix de selecció és més sovint un cas de dades involuntàries o inevitablement esbiaixades. Assegureu-vos d’elaborar algunes de les àrees on es pot produir un biaix de selecció, com ara el mostreig, l’interval de temps, les dades i l’atitud. A continuació, doneu alguns exemples de com les tècniques d’aprofitament com ara la realització de mostres i la potenciació poden ajudar-vos a treballar entorn de mostres no aleatòries.

Si parleu de l’entrevista quan parleu amb representants de departaments menys tècnics, utilitzeu un exemple fàcilment digerible que il·lustri clarament el biaix de selecció. El científic de dades, Eric Hollingsworth, fa referència a una lliçó apresa del brot de la grip aviària del 2011, en què “només es comptaven persones molt malaltes” en una mostra estadística de “casos confirmats”. El 80% resultant va declarar la mortalitat, tan greu a causa del biaix de selecció, va crear una por molt estesa.

7. "Com es poden tractar els valors anteriors?"

Aquesta és una pregunta d’entrevista habitual als científics de dades, ja que revela com utilitzeu les dades que us proporcionen, els mètodes que feu servir per processar aquestes dades i si esteu disposats a plantejar-vos el temps per avaluar cada informació.

Primer voldreu parlar del que constitueix anteriorment, com a nombres que existeixen fora del grup de dades d'un gràfic, com a 2-3 desviacions estàndard lluny de la mitjana, etc. El següent pas per afrontar els outliers és avaluar per què van passar.

S’elimina fàcilment una petita quantitat de outliers que es poden atribuir a un simple error humà o de màquina. Tingueu en compte, però, que fins i tot un únic anterior pot ser un punt de dades clau en lloc d’un problema, ja que pot indicar l’èxit d’una única tàctica de màrqueting, un nou ingredient o una línia de productes.

A continuació, voldreu explicar com afrontar un gran nombre de valors superiors, cosa que requereix solucions més complexes. Per exemple, potser haureu de canviar el model que feu servir, normalitzar les dades a la mitjana o fer servir un algoritme forestal aleatori. Un cop més, intenteu utilitzar un cas de la vida real de la vostra experiència com a científic de dades per explicar les tàctiques correctes.

8. "Per què és important la neteja de dades?"

La recollida de dades i la neteja són una part dominant de la vostra feina com a científic en dades, ocupant fins a un 80% del seu temps. Sigui quina sigui la indústria que sol·liciteu, les preguntes de l’entrevista sempre inclouran sobre per què és important la neteja de dades. Els entrevistadors també preguntaran sobre les vostres tècniques i programes de neteja preferits.

Heu de subratllar la necessitat de dades netes per treure conclusions correctes, però no només es tracta dels números. Expliqueu com començar amb dades completes, exactes, vàlides i uniformes sobre els seus negocis. Els principals avantatges a discutir són:

  • millora de la presa de decisions sobre els objectius de l’empresa
  • adquisició i orientació de clients més ràpida de clients anteriors
  • estalvi de temps i recursos per eliminar dades inexactes o duplicades
  • la productivitat millorada
  • augmentar la moral de l’equip gràcies a resultats eficients i precisos repetits

9. "Quin és l'objectiu de la prova A / B?"

Les preguntes sobre proves A / B durant la vostra entrevista per obtenir una posició de científic de dades poden començar amb una referència més genèrica a l’ús de disseny experimental per respondre a una sola consulta sobre el comportament o les preferències dels usuaris. L'objectiu de provar una variable de disseny de llocs web, aplicacions o butlletins és simplement avaluar si un canvi augmentarà els tipus d'interès, la participació i la conversió.

Una forma de diferenciar-se per respondre a aquest tipus de preguntes d'entrevistes és discutir com altres científics de dades poden treure conclusions incorrectes de les proves A / B. Els entrebancs possibles inclouen:

  • no recopilar prou dades durant un període de temps suficient
  • provant massa variables alhora
  • sense tenir en compte factors externs que poden afectar el trànsit durant el període de prova
  • obviant petites guanys que es poden generar amb el pas del temps i combinar-se amb altres canvis positius per augmentar els ingressos
  • falten interpretacions de grans imatges com a guanys o pèrdues financeres netes respecte dels tipus de conversió

A part d’assenyalar aquests problemes, haureu d’expressar com els resoldríeu, o, millor encara, com ja els heu evitat en els vostres anteriors projectes de ciències de dades.

10. "Teniu 48 hores per resoldre aquest repte de codificació".

El repte de la codificació pot ser una manera inicial de detectar possibles científics de dades, o pot ser un segon pas en el procés d’entrevistes després d’haver buidat el primer obstacle amb un reclutador o un gestor de contractació. Es pot tractar d'una prova in situ que dura de 30 minuts a 2 hores, on es farà una codificació a la pissarra o a un teclat a la vista de l'entrevistador. Sovint se us ofereix una selecció d'idioma, però prepareu-vos per codificar en SQL o Python.

Algunes empreses assignen tasques més llargues, amb terminis de fins a una setmana. Els reptes de la pissarra poden requerir escriure consultes SQL bastant simples, però les proves més llargues són, per descomptat, més complexes. Normalment, se us demana dades i us demanarà que feu prediccions específiques mitjançant aquestes dades, i haureu de mostrar el vostre treball. Per exemple, a una recent entrevista amb científics de dades, es van donar dades d’Airbnb i se li va demanar predir els preus de l’habitatge en funció de les característiques d’allotjament.

Els entrevistadors voldran discutir les vostres opcions, les hipòtesis que vau fer, les funcions que vau triar, per què heu utilitzat certs algoritmes i molt més. Sovint, la resposta a què arribeu és menys important que el vostre procés, creativitat, llegibilitat de codis i disseny.

Aquesta pot ser una experiència d'entrevista nerviosa, així que prepareu-vos creant i completant reptes de codificació de pràctiques amb amics o col·legues del camp de la ciència de dades. També podeu visitar llocs com Leetcode i SQLZOO per fer exercicis de codificació. Entrevistes reals reals amb problemes algoritmics i de disseny de sistemes estan disponibles de forma gratuïta a través de Interviewing.io.

Com podeu veure, les preguntes d’entrevistes per a científics de dades poden ser difícils i el procés global pot ser llarg i esgotador. Un dels consells més importants de l’entrevista és mantenir-se positiu, encara que consideri que una part del procés de l’entrevista va anar malament. Sovint som més difícils per a nosaltres mateixos que els altres, i encara podríeu acomiadar-vos del treball malgrat no obtenir totes les respostes tan perfectes com us hauria agradat.

Si no perdeu l'oportunitat, demaneu comentaris i utilitzeu-lo per millorar en la vostra propera experiència d'entrevista. Al cap i a la fi, molts científics de dades ben establerts van ser rebutjats de diverses posicions i van seguir aconseguint un èxit en els llocs de treball que millor van ser els més adequats.

Quines preguntes i reptes de codificació us heu trobat a l’hora de provar una feina de ciències de dades? Uniu-vos a la discussió als comentaris següents i ajudeu els companys científics a preparar-vos per a la propera entrevista!

Deixa El Teu Comentari

Please enter your comment!
Please enter your name here