File Originale (in Inglese) - Original File Here
Traduzione in Italiano a Cura di @volpoh
Inizialmente ho creato questo progetto come una sorta di "to-do list" degli argomenti da studiare per diventare un software engineer, ma è cresciuta fino a diventare ciò che potete vedere oggi. Dopo aver seguito questo percorso di studio, Sono stato preso come Software Development Engineer ad Amazon! Probabilmente non hai bisogno di studiare tanto quanto ho studiato io. Comunque, tutto ciò di cui hai bisogno è qua.
Ho studiato dalle 8 alle 12 ore al giorno, per diversi mesi. Questa è la mia storia: Perché ho studiato full-time per 8 mesi per un colloquio Google (Articolo in Inglese)
Nota Bene: Non avrai bisogno di studiare tanto quanto ho studiato io. Ho sprecato un sacco di tempo su argomenti evitabili. Più informazioni riguardo questo qua sotto. Ti aiuterò ad arrivare ai tuoi obiettivi senza sprecare il tuo prezioso tempo.
La lista proposta qua sotto ti preparerà egregiamente per un colloquio tecnico e per qualsiasi azienda di informatica, anche per le quelle Big come Amazon, Facebook, Google e Microsoft.
Buona fortuna!
Traduzioni:
Traduzioni in corso:
Questo è il mio piano di studio distribuito su più mesi per diventare un software engineer per una grande azienda.
Requisiti:
- Una minima esperienza con la programmazione (variabili, cicli, metodi/funzioni, etc)
- Pazienza
- Tempo
Ricorda che questo è un piano di studio per software engineering, non per web development. Grandi aziende come Google, Amazon, Facebook e Microsoft considerano il software engineering molto diverso dal web development. Per esempio, Amazon ha dei Frontend Engineers (FEE) e dei Software Development Engineers (SDE). Questi sono due ruoli separati e i colloqui per queste posizioni non saranno gli stessi, dato che ogni reparto ha le sue peculiarità. Queste aziende esigono conoscenza in ambito software development/ruoli dell'engineering.
- Che Cos'è?
- Perché Usarlo?
- Come Usarlo
- Non Pensare di non Essere Abbastanza Intelligente
- Un Appunto Riguardo le Risorse Video
- Scegli un Linguaggio di Programmazione
- Libri per Studiare Strutture di Dati e Algoritmi
- Libri per la Preparazione in Vista dei Colloqui
- Non Commettere i Miei Stessi Errori
- Cosa Non Sarà Trattato
- Il Piano Giornaliero
- Domande per Esercitarsi in Vista del Colloquio
- Problemi di Coding
- Complessità degli Algoritmi / O-Grande / Stima Asintotica
- Strutture Dati
- Più Teoria
- Alberi (Trees)
- Alberi - Appunti & Background
- Alberi Binari di Ricerca: BSTs
- Heap (Mucchio) / Priority Queue (Coda di Priorità) / Heap Binario (Mucchio Binario)
- Alberi Bilanciati di RIcerca (Concetti Generali)
- traversali: preorder, inorder, postorder, BFS (ricerca in ampiezza), DFS (ricerca in profondita)
- Sorting (Ordinamento)
- selection (per selezione)
- insertion (per inserzione)
- heapsort
- quicksort
- merge sort
- Grafi (Graphs)
- directed (Orientati)
- undirected (Non Orientati)
- adjacency matrix (Matrice delle Adiacenze)
- adjacency list (Lista delle Adiacenze)
- trasversali: BFS (ricerca in ampiezza), DFS (ricerca in profondita)
- Ancora Più Teoria
- Ricorsione
- Programmazione Dinamica
- Schemi Progettuali (Design Patterns)
- Calcolo Combinatorio (n sopra k) & Probabilità
- NP, NP-Completo e Algoritmi di Approssimazione
- Come i Computer Processano un Programma
- Caches
- Processi e Threads
- Testing
- Ricerca Tramite Pattern-Matching e Manipolazione delle Stringhe
- Tries
- Numeri con Decimali (Floats)
- Unicode
- Ordine dei Byte (Endianness)
- Networking
- Revisione Finale
- Aggiorna il tuo Curriculum Vitae
- Trova un Lavoro
- Colloquio & Preparazione Generale
- Ragiona Riguardo la Data del Colloquio
- Preparati Domande per l'Esaminatore
- Una Volta Ottenuto il Lavoro
---------------- Qua Sotto Sono Riportato Argomenti Facoltativi ----------------
- Libri Aggiuntivi
- System Design, Scalabilità, Gestione dei Dati (Solo se hai più di 4+ anni di esperienza)
- Argomenti Aggiuntiva
- Compilatori
- Emacs e vi(m)
- Tools per Linea di Comando Unix
- Teoria delle Informazioni
- Parità & Codice di Hamming
- Entropia
- Crittografia
- Compressione
- Sicurezza
- Garbage Collection
- Programmazione Parallela
- Messaggistica, Serializzazione e Sistemi di Gestione della Coda (Queueing Systems)
- A*
- Trasformata di Fourier Veloce
- Bloom Filter
- HyperLogLog
- Locality-Sensitive Hashing
- Alberi di Van Emde Boas
- Strutture Dati Aumentate
- Alberi di Ricerca Bilanciati
- Alberi AVL
- Alberi Splay
- Alberi Rosso/Nero (Red/Black)
- Alberi di Ricerca 2-3
- Alberi 2-3-4 (o Alberi 2-4)
- Alberi N-ary (anche detti Alberi K-ary o Alberi M-ary)
- Alberi B
- Alberi k-D
- Skip lists
- Rete di Flussi
- Disgiunzione & Union Find (MFSET)
- Matematica per la Processazione Veloce (Fast Processing)
- Treap
- Programmazione Lineare
- Geometria, Inviluppo Convesso
- Matematica Discreta
- Machine Learning
- Dettagli Aggiuntivi per Alcuni Temi Trattati
- Video
- Corsi di Informatica
- Documenti
Se vuoi trovare lavoro come software engineer per una grande azienda, questi sono i concetti che devi sapere.
Se hai perso l'occasione di prendere una laurea in informatica, come io ho fatto, tutto questo ti aiuterà a recuperare 5 anni della tua vita.
Quando ho iniziato questo progetto, non sapevo nulla, dallo stack fino all'heap, non conoscevo O-Grande o nulla riguardo gli alberi e i grafi. Se avessi dovuto scrivere un algoritmo di ordinamento da zero, ti assicuro che sarebbe stato terribile. Ogni struttura dati che avevo usato era già integrata nel linguaggio e non sapevo assolutamente come fossero implementate. Non ho mai dovuto gestire la memoria tralasciando i momenti in cui un programma returnava un errore del tipo "Out of Memory", che avrei poi risolto, cercando una soluzione. Nella mia vita ho usato alcuni array multidimensionali e migliaia di array associativi, ma non ho mai creato strutture dati da zero.
Il piano è lungo. Potrebbe richiedere mesi, ma se si ha un po' di familiarità con queste cose già partirete avvantaggiati.
Tutto ciò che segue rappresenta la cornice degli attuali argomenti, che si dovrebbero affrontare dall'alto verso il basso.
Sto usando le funzionalità del Markdown di Github, comprese le task-liste per monitorare i propri progressi.
Su questa pagina, clicca il bottone in alto con scritto "Code", e clicca "Download ZIP". Unzippa il file e potrai lavorare con il file testuale.
Se lo aprirai con un editor di testo che sa interpretare il linguaggio markdown (.md), allora leggerai il testo formattato.
Crea un nuovo branch affinché tu possa tenere aggiornata la task list, semplicemente mettendo una 'x' nelle parentesi quadrate, così: [x]
Forka un branch e segui le istruzioni qua sotto
Forka la repository https://github.com/jwasham/coding-interview-university cliccando sul pulsante Fork.
Clona nella tua repository locale:
git clone [email protected]:<your_github_username>/coding-interview-university.git
git checkout -b progress
git remote add jwasham https://github.com/jwasham/coding-interview-university
git fetch --all
Contrassegna con una X le task che hai completato:
git add .
git commit -m "Marked x"
git rebase jwasham/main
git push --set-upstream origin progress
git push --force
- I software engineers di successo sono intelligenti, ma molti di loro hanno insicurezze riguardo la loro bravura, pensando di non essere abbastanza.
- Il mito del Programmatore Genio (Video in Inglese)
- È Pericoloso Andare da Soli: Sconfiggere i Mostri Invisibili nell'Ambito Tech (Articolo in Inglese)
lcuni video sono disponibili solo iscrivendosi a un corso Coursera o Edx. Questi vengono chiamati MOOCs. A volte le lezioni non saranno disponibili immediatamente, quindi dovrai aspettare un paio di mesi senza averne accesso.
Sarebbe bello sostituire le risorse dei corsi online con fonti pubbliche gratuite e sempre disponibili, come i video di Youtube (preferibilmente lezioni universitarie), in modo che le persone possono studiare in qualsiasi momento e non solo quando un determinato corso online è disponibile.
Avrete bisogno di scegliere un linguaggio di programmazione per i colloqui che farete, ma sarà necessario trovare anche un linguaggio da utilizzare per studiare i concetti di informatica.
Sarebbe perfetto se il linguaggio fosse lo stesso per entrambi gli scopi così da poter essere costante solo su un linguaggio.
Quando ho fatto questo piano di studio, ho usato principalmente due linguaggi: C e Python
- C: Bassissimo Livello. Permette di gestire puntatori e allocazione/deallocazione della memoria, cosicché si possano toccare gli algoritmi
e le strutture dati con le proprie mani.
In linguaggi di alto livello, come Python o Java, tutto questo viene mascherato dal linguaggio stesso. Nel lavoro di tutti i giorni,
un linguaggio di basso livello è terrificante, ma quando si stanno imparando le basi è utilissimo sentirsi vicini al cuore di tutto ciò.
- C è ovunque. Vedrai esempi nei libri, nelle lezioni, nei video, OVUNQUE durante il tuo corso di apprendimento.
- Il Linguaggio di Programmazione C, Vol. 2 (Libro in Inglese)
- Questo è un libro abbastanza corto, ma ti darà una grande mano riguardo il linguaggio C e, se ti allenerai un po', diventerai velocemente un esperto. Capire C aiuta a comprendere il funzionamento dei programmi e della memoria.
- Non c'è bisogno di studiare in profondita il libro (o comunque finirlo). Basterà arrivare al punto dove sarai a tuo agio nel leggere e nello scrivere in C.
- Risposte alle Domande del Libro
- Python: Moderno e molto espressivo, l'ho imparato perché è semplicemente utilissimo e ti permette di scrivere codici brevi, ma potenti.
Questa è una mia preferenza, ovviamente te sei libero di scegliere.
Forse non ne avrai bisogno, ma ecco una lista di siti utili per imparare a programmare online:
Puoi usare un qualsiasi linguaggio di programmazione per la parte tecnica del colloquio, ma le grandi aziende richiedono certi linguaggi, quali:
- C++
- Java
- Python
Potresti usare anche questi, ma valuta bene. Ci potrebbero essere delle contro-avvertenze:
- JavaScript
- Ruby
Questo è un articolo che ho scritto riguardo la scelta del linguaggio: Scegli il Linguaggio per il tuo Colloquio Tecnico (Articolo in Inglese). Questo è l'articolo originale su cui si basa il post: Scegliere un Linguaggio di Programmazione per il Proprio Colloquio (Articolo in Inglese)
Devi essere tranquillo nel linguaggio che scegli, oltre che il più competente possiile.
Informati di più riguardo la scelta:
Risorse Specifiche per i Linguaggi (Pagina in Inglese)
Il libro che sceglierai creerà le fondamenta delle tue conoscenze nell'ambito informatico.
Scegline uno solo. Cerca di sentirti a tuo agio nel linguaggio che sceglierai, dovrai leggere e scrivere molto codice.
- Algoritmi in C, Parti 1-5, 3za Edizione (Libro in Inglese)
- Fondamentali, Strutture Dati, Ordinamento, Ricerca e Algoritmi per Grafi
- Data Structures and Algorithms in Python (Libro in Inglese)
- di Goodrich, Tamassia, Goldwasser
- Ho amato questo libro. Ricopre tutti gli argomenti e più.
- Codice "Pythonico"
- La mia Recensione (Articolo in Inglese): https://startupnextdoor.com/book-report-data-structures-and-algorithms-in-python/
A tua scelta:
- Goodrich, Tamassia, Goldwasser
- Sedgewick e Wayne:
- Algoritmi (Libro in Inglese)
- Corsi gratis di Coursera che possono sostituire il libro (creati dagli autori stessi!):
A tua scelta:
- Goodrich, Tamassia, and Mount
- Sedgewick e Wayne
Non è necessario comprare molti libri. Onestamente, "Spaccare il Colloquio Pratico di Coding (Libro in Inglese)" è sufficiente, però io ne ho comprati altri per fare più pratica, ma faccio sempre troppo.
Io li ho comprati entrambi e mi hanno permesso di impratichirmi molto:
- Colloqui Pratichi Smascherati: Programma la tua Via di Salvezza, 4ta Edizione (Libro in Inglese)
- Risposte in C++ e Java
- Questo è un ottimo riscaldamento per il prossimo libro
- Non troppo difficile. La maggior parte dei problemi potrebbero essere più facili rispetto ai colloquio (da quello che ho letto)
- Spaccare il Colloquio Pratico di Coding, 6ta Edizione (Libro in Inglese)
- Risposte in Java
Scegline uno:
- Elementi dei Colloqui di Programmazione (C++) (Libro in Inglese)
- Elementi dei Colloqui di Programmazione (Python) (Libro in Inglese)
- Elementi dei Colloqui di Programmazione (Java) (Libro in Inglese) - Progetto di Gruppo - Metodi e Test per ogni problema del libro (Repository in Inglese)
Questa lista è cresciuta esponenzialmente negli ultimi mesi, e sì, la situazione è sfuggita di mano.
Questi sono alcuni dei miei errori, così che tu possa evitarli, risparmiando mesi di tempo.
Ho guardato ore e ore di video, preso tanti appunti, ma mesi dopo ricordavo davvero poco. Ho speso 3 giorni a leggere i miei appunti e a farmi flash-cards affinchè le potessi revisionare. Non mi serviva tutta quella conoscenza.
Perfavore leggilo, così da non fare il mio stesso errore:
Mantenere la Conoscenza in Ambito Informatico (Articolo in Inglese).
Per risolvere questo problema, ho creato un piccolo sito web di flashcards dove è possibile trovare 2 tipologie di carte: generali e codice. Ognuna ha una formattazione diversa. Il sito è ottimizzato per telefono e tablet, affinché potessi revisionare da lì.
Crea le tue flash-cards gratuitamente:
SCONSIGLIO VIVAMENTE di Usare le mie Flash-Cards Sono troppe e alcune eccessivamente complesse.
Ma se non vuoi darmi ascolto, eccole qua:
- DataBase delle mie Flash-Cards (1200 cards) (Repository e Cards in Inglese)
- DataBase delle mie Flash-Cards (difficoltà estrema - 1800 cards) (Repository e Cards in Inglese)
Tieni a mente che ho creato carte per qualsiasi argomento, dall'assembly alle curiosità su python, fino al machine learning e alla statistica. Tutto ciò è molto più di quanto è veramente necessario.
Riguardo le Flash-Cards: La prima volta che comprendi la domanda e rispondi correttamente, non mettere via la card. Devi rispondere più volte alla stessa carta prima di considerarla appresa. La ripetizione farà penetrare la vostra conoscenza nei meandri del nostro cervello.
Un alternativa al mio sito di è Anki, sito che è stato consigliatomi parecchie volte. Usa un sistema di ripetizione che aiuta a memorizzare meglio. Facile da usare, disponibile su qualsiasi piattaforma e auto-sincronizzato con altri tuoi dispositivi, ha un costa di $25 su iOS, ma è disponibile su altre piattaforme.
Il mio DataBase di Flash-Cards in Anki: https://ankiweb.net/shared/info/25173560 (grazie a @xiewenya).
Alcuni studenti mi hanno fatto notare problemi di formattazione con degli spazi vuoti, facilmente risolvibili così: apri un mazzo, modifica il mazzo, clicca sulle carte, seleziona "styling" e aggiungi "white-space: pre;" alla classe "Card".
QUESTO È MOLTO IMPORTANTE.
Comincia ad esercitarti con delle possibile domande da colloquio durante lo studio delle strutture dati e degli algoritmi.
Dovrai applicare tutto ciò che stai imparando per risolvere i problemi, o ti dimenticherai tutto. Io ho fatto questo errore.
Appena hai imparato un argomento e pensi di saperlo padroneggiare bene (come ad esempio le linked lists):
- Apri uno dei libri di preparazione ai colloqui (o siti internet di problem-solving, listati poi sotto)
- Rispondi a 2 o 3 domane riguardo le linked lists.
- Studia il prossimo argomento.
- Dopo, torna indietro e rispondi ad altre 2 o 3 domande sulle linked list.
- Fai questo con ogni nuovo argomento che dovrai affrontare.
Continua ad esercitarti con i problemi durante la tua fase di studio, non dopo.
Non verrai assunto per la tua conoscenza, ma per come applicherai la tua conoscenza.
Ci sono molte risorse da consultare, riportate poi sotto.
Ci sono un sacco di distrazioni che potrebbero toglierti tempo prezioso. Focalizzarsi e concentrarsi è difficile. Metti un po' di musica senza lyrics e ti saprai concentrare molto bene.
Queste tecnologie sono fondamentali, ma non fanno parte di questo piano di studio:
- SQL
- Javascript (JS)
- HTML, CSS e altre tecnologie front-end
Questo corso tratta moltissimi argomenti. Ognuno di questi ti terrà impegnato per qualche giorno, o addirittura per settimane. Dipende dal tuo programma.
Ogni giorno, guarda il prossimo argomento nella lista, guarda video a riguardo e implementa degli appunti di quelle strutture dati o algoritmi del linguaggio a tua scelta per il corso.
Puoi vedere i miei codici qua:
Non devi memorizzare ogni algoritmo. Devi essere capace di capirlo abbastanza da poterlo implementare tu stesso.
Perché questo paragrafo? Non sono ancora pronto ad un colloquio.
Allora torna in dietro e leggi questo.
Perché esercitarsi con dei proble-solving:
- Ricognizione del problema e come le strutture dati ed algoritmi possono essere utilizzate
- Raccolta dei requisiti per risolvere il problema
- Mentre programmi, spiega il problema e la soluzione, proprio come succederebbe durante il colloquio
- Programma su foglio di carta o su una lavagna, non al computer
- Trova la complessità temporale e spaziale delle tue soluzioni (vedi O-Grande sotto)
- Testa le tue soluzioni
C'è una bellissima introduzione per la metodica della comunicazione nei colloqui di problem-solving. Lo scoprirai anche nei libri di preparazione, ma ho trovato questo articolo fatto molto bene: Design degli Algoritmi (Articolo in Inglese)
Scrivi il codice su carta o su una lavagna, non su un computer. Provalo con qualche input di prova. Poi riscrivilo e testalo su un computer.
Se non hai una lavagnetta a casa, prendi un quadernone per fogli da disegno in una qualsiasi cartolibreria. Puoi metterti comodo sul divano e programmare. Questa è la mia "lavagnetta da divano". Ho aggiunto la penna nella foto per far capire le dimensioni. Se usi una penna, vorrai poter cancellare. Diventa subito un casino. Io uso una matita e una gomma.
Risolvere questi problemi di coding non serve a memorizzare.
Non dimenticarti dei libri per prepararti al colloquio.
Risolvere i Problemi:
- Come Trovare una Soluzione (Articolo in Inglese)
- Come Sezzionare una Richiesta di un Problema di Topcoder (Articolo in Inglese)
Video sulle Domande per Colloqui Tecnici:
- IDeserve (88 video, in Inglese)
- Tushar Roy (5 playlists, in Inglese)
- Perfetto per le procedure dettagliate passo a passo per le soluzioni dei problemi
- Nick White - LeetCode Solutions (187 video, in Inglese)
- Ottima spiegazione del codice e della soluzione
- Si riesce a guardare molti video in poco tempo
- FisherCoder - Soluzioni di LeetCode (Video in Inglese)
Siti per Mettersi alla Prova:
- LeetCode (Sito in Inglese)
- Il mio sito preferito per il problem-solving. Vale assolutamente fare un abbonamento per i mesi di preparazione necessari.
- Guarda i video di Nick White e FisherCoder listati sopra per le procedure passo a passo.
- HackerRank (Sito in Inglese)
- TopCoder (Sito in Inglese)
- Geeks for Geeks (Sito in Inglese)
- InterviewBit (Sito in Inglese)
- Project Euler (Sito in Inglese)
Ok, abbiamo parlato abbastanza, cominciamo ad imparare!
Ma non dimenticare di esercitarti con i problemi, anche durante lo studio!
- Nulla da implementare qua, guarderai solo video e prenderai appunti! Yuppi!
- Ci sono un sacco di video qua. Basta guardarne abbastanza finché non si comprende l'argomento. Potrai sempre tornare indietro per ripassare.
- Non preoccuparti se non capisci tutta la matematica che c'è dietro.
- Dovrai solo capire come esprimere la complessità di un algoritmo con la O-Grande.
- Harvard CS50 - Notazione Asintotica (Video in Inglese)
- Notazione della Grande-O (tutorial generale veloce) (Video in Inglese)
- Notazione della Grande-O (e Omega e Theta) - la migliore spiegazione matematica (Video in Inglese)
- Skiena (Video in Inglese)
- UC Berkeley Grande-O (Video in Inglese)
- Analisi Ammortizzata (Video in Inglese)
- TopCoder (include relazioni di ricorrenza e teoremi principali):
- Cheat-Sheet
- [Review] Big-O notation in 5 minutes (video)
Bene, direi che può bastare.
Quando leggerai la parte di "Spaccare il Colloquio Pratico di Coding", c'è un capitolo riguardo questo e alla fine c'è un quiz per testare la tua capacità nell'identificare la complessità del runtime di diversi algoritmi.
-
- Riguardo gli Arrays:
- Implementare un vettore (array mutabile con grandezza automatica):
- Programma usando arrays, puntatori e l'aritmetica dei puntatori per raggiungere un index, piuttosto che usare l'indexing.
- Array con dati non raffinati (raw) e memoria allocata
- puoi allocare array di interi, ma non usare le sue features
- comincia con 16, o se il numero iniziale è maggiore, usa delle potenze del 2 - 16, 32, 64, 128
- size() - numero degli elementi
- capacity() - numero degli elementi che può contenere in totale
- is_empty() - se l'array è vuoto
- at(index) - fa il return di un item all'index dato, esplode se l'index è out of bounds (letteralmente, "fuori dai limiti")
- push(item) - inserisce (pusha) un item alla fine di un array
- insert(index, item) - inserisce un item all'index dato, spostando gli altri item verso destra (verso la fine)
- prepend(item) - come usare insert() con index 0
- pop() - rimuove l'elemento alla fine e lo returna
- delete(index) - elimina l'item all'index dato, spostando gli altri item verso sinistra (verso l'inizio)
- remove(item) - cerca il valore dato e rimuove il suo index (funziona anche se si trova in più caselle)
- find(item) - cerca un valore e returna il primo index contenente quell'item, returna -1 se non viene trovato
- resize(new_capacity) // funzione private
- quando raggiungi la capacità massima, la raddoppia
- quando viene fatto il pop() di un item, se la grandezza è 1/4 della capacità, allora la reduce di metà
- Tempo
- O(1) per aggiungere/rimuovere alla fine (amortized for allocations for more space), indexare o aggiornare
- O(n) per aggiungere/rimuovere in qualsiasi punto
- Spazio
- contiguo in memoria, quindi la vicinanza aiuta a migliorare la performance
- spazio necessario = (capacità dell'array, che è >= n) * grandezza di un item, ma anche se 2n, rimane O(n)
-
- Descrizione:
- C Code (Video in Inglese) - non il video intero, ma solo nozioni sulla struttura del nodo e l'allocazione della memoria
- Linked List vs Arrays:
- Perché dovresti evitare le Linked Lists (Video in Inglese)
- Ti aiuto un po': hai bisogno della conoscenza riguardo puntatori di puntatori: (per quando passi un puntatore ad una funzione che potrebbe cambiare l'indirizzo a cui il puntatore punta) Questa pagina serve solo ad avere un assaggio dei puntatori ai puntatori. Non consiglio di seguire l'ordine di questa lista. La scorrevolezza nel leggere viene persa per colpa di una mancanza di intelligenza.
- Implementazione (Fatto con puntatori alla coda e senza):
- size() - returna il numero di elementi nella lista
- empty() - returna vero se la lista è vuota, altrimenti falso
- value_at(index) - returna il valore in posizione index (partendo da 0 per il primo)
- push_front(value) - aggiungi un item in testa alla lista
- pop_front() - rimuove l'item in testa alla lista e ne returna il valore
- push_back(value) - aggiunge un elemento in coda alla lista
- pop_back() - rimuove l'elemento finale della lista e ne returna il valore
- front() - returna il valore all'inizio della lista
- back() - returna il valore alla fine della lista
- insert(index, value) - inserisce il valore in posizione index, così l'elemento attuale in posizione index punterà all'elemento successivo
- erase(index) - rimuove un nodo ad un index dato
- value_n_from_end(n) - returna un valore in posizione n rispetto la fine della lista
- reverse() - reversa la lista
- remove_value(value) - rimuove il primo elemento nella lista avente il valore dato
- Liste Linkate Doppiamente
- Descrizione (Video in Inglese)
- Non c'è bisogno di implementarle
-
- Stacks (Video in Inglese)
- [Review] Stacks in 3 minutes (video)
- Non saranno implementati. Esercitarsi con l'array è quasi banale.
-
- Queue (Video in Inglese)
- Buffer Circolare/FIFO
- [Review] Queues in 3 minutes (video)
- Implementazione usando le linked list, con puntatore alla coda:
- enqueue(value) - aggiunge un valore alla posizione della coda
- dequeue() - returna il valore aggiunto per ultimo e lo rimuove
- empty() - controlla se è vuota o meno
- Implementazione usando gli array con memoria allocata fissa:
- enqueue(value) - aggiunge un item alla fine
- dequeue() - returna il valore aggiunto per ultimo e lo rimuove
- empty() - controlla se la queue è vuota
- full() - controlla se la queue è piena
- Costi:
- una implementazione sbagliata usando le linked list dove aggiungi alla queue dalla testa e togli dalla coda porterebbe ad O(n) perché avrai bisogno dal prossimo elemento fino alla fine, causando una dequeue trasversale per tutta la lista.
- enqueue: O(1) (ammortizzata, linked list e array [approfondendo])
- dequeue: O(1) (linked list e array)
- empty: O(1) (linked list e array)
-
-
Video:
- Hashing con Chaining (Video in Inglese)
- Table Doubling, Karp-Rabin (Video in Inglese)
- Indirizzamento Aperto, Hashing Crittografico (Video in Inglese)
- PyCon 2010: Il Dizionario, ma Più Potente (Video in Inglese)
- PyCon 2017: Dizionario, ma ancora Più Potente (Video in Inglese)
- (Avanzato) Randomizzazione: Universale & Hashing Perfetto (Video in Inglese)
- (Avanzato) L'hashing perfetto (Video in Inglese)
- [Review] Hash tables in 4 minutes (video)
-
Corsi Online:
-
Implementazione con gli array usando il sondaggio (probing) lineare
- hash(k, m) - m è la grandezza dell'hash table
- add(key, value) - se la chiave esiste già, il valore viene aggiornato
- exists(key) - se la chiave esiste
- get(key) - prende il valore della chiave
- remove(key) - rimuove il valore con chiave data
-
-
- Ricerca Binaria (Video in Inglese)
- Ricerca Binaria (Video in Inglese)
- dettagli
- progetto
- [Review] Binary search in 4 minutes (video)
- Implementazione:
- ricerca binaria (su array ordinati di interi)
- ricerca binaria usando la ricorsione
-
- Cheat-sheet sui bit - dovrai arrivare a conoscere le potenze del 2 da 2^1 fino a 2^16 e 2^32
- Preparati bene sulla manipolazione dei bit tramite questi operatori: &, |, ^, ~, >>, <<
- words (Articolo in Inglese)
- Una buona Introduzione: Manipolazione dei Bit (Video in Inglese)
- Tutorial di programmazione C 2-10: Operazioni Bit a Bit (Video in Inglese)
- Manipolazione dei Bit
- Operazioni bit a bit
- Bithacks
- Il Bit Twiddler
- Il Bit Twiddler Interattivo
- Trucchi su i Bit (Video in Inglese)
- Practice Operations
- 2s and 1s complement
- Count set bits
- Swap values:
- Absolute value:
-
- Playlist: Alberi (Video in Inglese)
- costruzione basica di un albero
- traversale
- algoritmi per la manipolazione
- BFS (ricerca in ampiezza) e DFS (ricerca in profondità) (Video in Inglese)
- Appunti BFS:
- livelli (BFS, usando una queue)
- complessità temporale: O(n)
- complessità spaziale: miglior caso: O(1) peggior caso: O(n/2)=O(n)
- Appunti DFS:
- complessità temporale: O(n)
- complessità spaziale: miglior caso: O(log n) - altezza media dell'albero peggior caso: O(n)
- inorder (DFS: sinistra, se stesso, destra)
- postorder (DFS: sinistra, destra, se stesso)
- preorder (DFS: se stesso, sinistra, destra)
- Appunti BFS:
- [Review] Breadth-first search in 4 minutes (video)
- [Review] Depth-first search in 4 minutes (video)
- [Review] Tree Traversal (playlist) in 11 minutes (video)
-
- Review Alberi Binari di Ricerca (Video in Inglese)
- Introduzione (Video in Inglese)
- MIT (Video in Inglese)
- C/C++:
- Alberi Binari di Ricerca - Implementazione in C/C++ (Video in Inglese)
- Implementazione BST - allocazione memoria su stack e heap (Video in Inglese)
- Trova il minimo e il massimo valore in un albero binario di ricerca (Video in Inglese)
- Trova l'altezza di un albero binario (Video in Inglese)
- Albero Binario Trasversale - strategie di ricerca in superficie e in profondità (Video in Inglese)
- Alberi Binari: Livelli Trasversali (Video in Inglese)
- Alberi Binari Trasversali: Preorder, Inorder, Postorder (Video in Inglese)
- Controlla se un albero binario è di ricerca o no (Video in Inglese)
- Eliminare un nodo da un albero binario di ricerca (Video in Inglese)
- Successore inorder in un albero binario di ricerca (Video in Inglese)
- Implementazione:
- insert // inserisci un valore nell'albero
- get_node_count // returna il numero di valori inseriti
- print_values // stampa i valori, dal minimo al massimo, dell'albero
- delete_tree // elimina l'albero
- is_in_tree // returna vero se è dato un valore esistente nell'albero
- get_height // returna l'altezza dell'albero (l'altezza di un albero con un singolo nodo è 1)
- get_min // returna il valore minimo all'interno dell'albero
- get_max // returna il valore massimo all'interno dell'albero
- is_binary_search_tree // returna se è un albero di ricerca binario o meno
- delete_value // elimina un valore
- get_successor // returna il valore maggiore successo al valore passato, -1 se non esiste
-
- visualizzato come un albero, ma è lineare nell'allocazione (array o linked list)
- Heap (Articolo in Inglese)
- Introduzione (Video in Inglese)
- Implementazione Ingenua (Video in Inglese)
- Alberi Binari (Video in Inglese)
- Osservazione sull'Altezza Degli Alberi (Video in Inglese)
- Operazioni Basiche (Video in Inglese)
- Alberi Binari Completi (Video in Inglese)
- Pseudocodice (Video in Inglese)
- Ordinamento Heap - consigli per iniziare (Video in Inglese)
- Ordinamento Heap (Video in Inglese)
- Costruire un heap (Video in Inglese)
- MIT: Heaps e Ordinamento Heap (Video in Inglese)
- CS 61B Lezione 24: Code di Priorità (Video in Inglese)
- Costruire un Heap (max-heap) (Video in Inglese)
- [Review] Heap (playlist) in 13 minutes (video)
- Implementa un max-heap:
- insert - inserisci un valore
- sift_up - neccessario per l'inserimento
- get_max - returna il valore massimo, senza rimuoverlo
- get_size() - returna il numero di elementi
- is_empty() - returna vero se l'heap è vuoto
- extract_max - returna il valore massimo, per poi rimuoverlo
- sift_down - necessario per l'extract_max
- remove(x) - rimuove un item all'index dato
- heapify - crea un heap da un array di elementi, necessario per heap_sort
- heap_sort() - prende un array non ordinato e lo ordina, da un valore massimo ad un valore minimo, che siano all'inizio o alla fine
-
Appunti:
- Implementazione degli ordinamenti & impara i migliori casi, peggiori casi e la complessità media di ognuno:
- no bubble sort - è terribile - O(n^2), tranne quando n <= 16
- Stabilità negli algoritmi di ordinamento ("Il Quicksort è stabile?")
- Quali algoritmi possono essere utilizzati nelle linked list? Quali per gli array? Quali per entrambi?
- Non raccomando l'ordinamento delle linked list, ma il merge sort è fattibile.
- Merge Sort per le Linked List (Articolo in Inglese)
- Implementazione degli ordinamenti & impara i migliori casi, peggiori casi e la complessità media di ognuno:
-
Per l'heapsort, leggi la struttura degli Heap sopra. Heap sort non è stabile, ma funziona bene
-
UC Berkeley:
-
Codice del merge sort:
-
Codice del quick sort:
-
Implementazione:
- Mergesort: O(n log n) caso medio e peggiore
- Quicksort O(n log n) caso medio
- Selection sort e insertion sort sono entrambi O(n^2) caso medio e peggiore
- Per l'heapsort, guarda l'Heap riportato sopra
-
Not required, but I recommended them:
As a summary, here is a visual representation of 15 sorting algorithms. If you need more detail on this subject, see "Sorting" section in Additional Detail on Some Subjects
I grafi possono essere usati per rappresentare molti problemi in informatica, perciò questo paragrafo sarà lungo, come quello degli alberi e dell'ordinamento.
-
Appunti:
- Esistono 4 modi basici per rappresentare un grafo in una memoria:
- oggetti e puntatori
- matrice delle adiacenze
- lista delle adiacenze
- mappa delle adiacenze
- Mettiti alla prova con ogni rappresentazione e imparane i pro e i contro
- BFS e DFS - impara la loro complessità computazionale, i loro trade-offs e come implementarli tramite codice
- Quando ti viene posto un problema, pensa subito ad una soluzione con i grafi, altrimenti trova un'altra strada
- Esistono 4 modi basici per rappresentare un grafo in una memoria:
-
MIT (Video in Inglese):
-
Lezioni di Skiena - Ottima introduzione:
- CSE373 2020 - Lezione 10 - Grafi (Video in Inglese)
- CSE373 2020 - Lezione 11 - Grafi Trasversali (Video in Inglese)
- CSE373 2020 - Lezione 12 - Ricerca in Profondità (Video in Inglese)
- CSE373 2020 - Lezione 13 - Alberi Ricoprenti Minimi (Video in Inglese)
- CSE373 2020 - Lezione 14 - Alberi Ricoprenti Minimi (parte 2) (Video in Inglese)
- CSE373 2020 - Lezione 15 - Algoritmi per i Grafi (parte 3) (Video in Inglese)
-
Grafi (revisione e altro):
- 6.006 Problema della ricerca del path più veloce (Video in Inglese)
- 6.006 Dijkstra (Video in Inglese)
- 6.006 Bellman-Ford (Video in Inglese)
- 6.006 Velocizzare Dijkstra (Video in Inglese)
- Aduni: Algoritmi per Grafi I - Ordinamento Topologico, Alberi Ricoprenti Minimi, Algoritmo di Prim - Lezione 6 (Video in Inglese)
- Aduni: Algoritmi per Grafi II - DFS, BFS, Algoritmo di Kruskal, Mfset (o Struttura Dati Disjoint-Set) - Lezione 7 (Video in Inglese)
- Aduni: Algoritmi per Grafi III: Il Path più Veloce - Lezione 8 (Video in Inglese)
- Aduni: Algoritmi per Grafi IV: Introduzione agli Algoritmi Geometrici - Lezione 9 (Video in Inglese)
- CS 61B 2014: Grafi Pesati (Video in Inglese)
- Algoritmi Greedy: Alberi Ricoprenti Minimi (Video in Inglese)
- Componenti Legati Strettamente, Algoritmo di Kosaraju e Algoritmi per Grafi (Video in Inglese)
- [Review] Shortest Path Algorithms (playlist) in 16 minutes (video)
- [Review] Minimum Spanning Trees (playlist) in 4 minutes (video)
-
Corsi di Coursera Completi:
-
Implementazione:
- DFS con lista di adiacenza (ricorsiva)
- DFS con lista di adiacenza (iterativa con stack)
- DFS con matrice di adiacenza (ricorsiva)
- DFS con matrice di adiacenza (iterativa con stack)
- BFS con lista di adiacenza
- BFS con matrice di adiacenza
- Path più corto da un punto singolo (Dijkstra)
- Alberi Ricoprenti Minimi
- Algoritmi basati con il DFS (guarda i video di Aduni elencati sopra):
- controlla il ciclo for (necessario per l'ordinamento topologico, poiché lo controlleremo all'inizio)
- ordinamento topologico
- conta i componenti connessi nel grafo
- lista dei componenti strettamente connessi
- controlla per i grafi bipartiti
-
- Stanford, Lezioni sulla ricorsione & backtracking:
- Quando è appropriato usarla?
- Perché la ricorsione in coda è migliore?
- 5 Semplici Step per risolvere Qualsiasi Problema di Ricorsione (Video in Inglese)
Backtracking Cheat-Sheet: Java (Articolo in Inglese) Python (Articolo in Inglese)
-
- Probabilmente non vedrai problemi di programmazione dinamica durante il tuo colloquio, ma è importante sapere classificare un problema come tale.
- Questo argomento può essere complesso, dato che ogni soluzione per problemi di programmazione dinamica (DP) va realizata tramite ricorsione e questo potrebbe ingannare.
- Consiglio di guardare molti esempi riguardo i problemi DP fino a che non comprenderai il meccanismo.
- Video:
- Skiena: CSE373 2020 - Lezione 19 - Introduzione alla Programmazione Dinamica (Video in Inglese)
- Skiena: CSE373 2020 - Lezione 20 - Modifica della Distanza (Video in Inglese)
- Skiena: CSE373 2020 - Lezione 20 - Modifica della Distanza (parte 2) (Video in Inglese)
- Skiena: CSE373 2020 - Lezione 21 - Programmazione Dinamica (Video in Inglese)
- Skiena: CSE373 2020 - Lezione 21 - Revisione Programmazione Dinamica (Video in Inglese)
- Simonson: Programmazione Dinamica 0 (comincia a 59:18) (Video in Inglese)
- Simonson: Programmazione Dinamica I - Lezione 11 (Video in Inglese)
- Simonson: Programmazione Dinamica II - Lezione 12 (Video in Inglese)
- Lista di problemi DP individuali (ognuno di quelli presentati è breve): Programmazione Dinamica (Video in Inglese)
- Appunti sulle lezioni di Yale:
- Coursera:
- Il problema della struttura secondaria dell'RNA (Video in Inglese)
- Un algoritmo di Programmazione Dinamica (Video in Inglese)
- Illustrare l'algoritmo di DP (Video in Inglese)
- Tempo di esecuzioone di un algoritmo di DP (Video in Inglese)
- DP vs. implementazione della ricorsione (Video in Inglese)
- Pairwise Sequence Alignment Globale (Video in Inglese)
- Pairwise Sequence Alignment Locale (Video in Inglese)
-
- Revisione veloce di UML (Video in Inglese)
- Impara questi pattern:
- strategy
- singleton
- adapter
- prototipo
- decorator
- visitor
- factory, factory astratto
- façade
- observer
- proxy
- delegate
- command
- state
- memento
- iterator
- composite
- flyweight
- Serie di video (27 video in Inglese)
- Libro: Prima i Design Patterns (Libro in Inglese)
- So che il libro canonico sarebbe "Design Patterns: Elements of Reusable Object-Oriented Software", ma questo proposto è migliore per i nuovi programmatori OO.
- Handy reference: 101 Design Pattern & Consigli per gli Sviluppatori
-
- Conoscenze di Matematica: Come trovare il Fattoriale, Permutazione e Combinazione (Video in Inglese)
- Make School: Probabilità (Video in Inglese)
- Make School: Ancora Probabilità e Processi Stocastici Markoviani (Video in Inglese)
- Khan Academy:
- Corso:
- Solo il Video - 41 (sono tutti semplici e brevi):
-
- Impara le classi più famose dei problemi NP-Completi, come il problema del commesso viaggiatore e il problema dello zaino, e impara a riconoscere un problema NP quando ti viene proposto durante il colloquio.
- Capisci cosa sia la NP-Completezza significa.
- Computational Complexity (Video in Inglese)
- Simonson:
- Skiena:
- Complessità: P, NP, NP-Completezza, Riduzioni (Video in Inglese)
- Complessità: Algoritmi di Approssimazione (Video in Inglese)
- Complessità: Algoritmi con Parametri Fissi (Video in Inglese)
- Peter Norvig discute riguardo una quasi perfetta soluzione per il problema del commesso viaggiatore:
- Pagine da 1048 a 1140 nel CLRS (se lo hai).
-
- Computer Science 162 - Operating Systems (25 video):
- for processes and threads see video 1-11
- Operating Systems and System Programming (Video in Inglese)
- What Is The Difference Between A Process And A Thread?
- Covers:
- Processes, Threads, Concurrency issues
- Difference between processes and threads
- Processes
- Threads
- Locks
- Mutexes
- Semaphores
- Monitors
- How they work?
- Deadlock
- Livelock
- CPU activity, interrupts, context switching
- Modern concurrency constructs with multicore processors
- Paging, segmentation and virtual memory (Video in Inglese)
- Interrupts (Video in Inglese)
- Process resource needs (memory: code, static storage, stack, heap, and also file descriptors, i/o)
- Thread resource needs (shares above (minus stack) with other threads in the same process but each has its own pc, stack counter, registers, and stack)
- Forking is really copy on write (read-only) until the new process writes to memory, then it does a full copy.
- Context switching
- How context switching is initiated by the operating system and underlying hardware?
- Processes, Threads, Concurrency issues
- threads in C++ (series - 10 video)
- CS 377 Spring '14: Operating Systems from University of Massachusetts
- concurrency in Python (video):
- Computer Science 162 - Operating Systems (25 video):
-
- To cover:
- how unit testing works
- what are mock objects
- what is integration testing
- what is dependency injection
- Agile Software Testing with James Bach (Video in Inglese)
- Open Lezione by James Bach on Software Testing (Video in Inglese)
- Steve Freeman - Test-Driven Development (that’s not what we meant) (Video in Inglese)
- Dependency injection:
- How to write tests
- To cover:
-
- Sedgewick - Suffix Arrays (Video in Inglese)
- Sedgewick - Substring Search (video)
- Search pattern in text (Video in Inglese)
If you need more detail on this subject, see "String Matching" section in Additional Detail on Some Subjects.
-
- Note there are different kinds of tries. Some have prefixes, some don't, and some use string instead of bits to track the path
- I read through code, but will not implement
- Sedgewick - Tries (3 video)
- Notes on Data Structures and Programming Techniques
- Short course video:
- The Trie: A Neglected Data Structure
- TopCoder - Using Tries
- Stanford Lezione (real world use case) (Video in Inglese)
- MIT, Advanced Data Structures, Strings (can get pretty obscure about halfway through) (Video in Inglese)
-
- Big And Little Endian
- Big Endian Vs Little Endian (Video in Inglese)
- Big And Little Endian Inside/Out (Video in Inglese)
- Very technical talk for kernel devs. Don't worry if most is over your head.
- The first half is enough.
-
- if you have networking experience or want to be a reliability engineer or operations engineer, expect questions
- Otherwise, this is just good to know
- Khan Academy
- UDP and TCP: Comparison of Transport Protocols (Video in Inglese)
- TCP/IP and the OSI Model Explained! (Video in Inglese)
- Packet Transmission across the Internet. Networking & TCP/IP tutorial. (Video in Inglese)
- HTTP (Video in Inglese)
- SSL and HTTPS (Video in Inglese)
- SSL/TLS (Video in Inglese)
- HTTP 2.0 (Video in Inglese)
- Video Series (21 video) (Video in Inglese)
- Subnetting Demystified - Part 5 CIDR Notation (Video in Inglese)
- Sockets:
This section will have shorter video that you can watch pretty quickly to review most of the important concepts.
It's nice if you want a refresher often.
- Series of 2-3 minutes short subject video (23 video)
- Series of 2-5 minutes short subject video - Michael Sambol (40 video):
- Sedgewick video - Algorithms I
- Sedgewick video - Algorithms II
- See Resume prep information in the books: "Cracking The Coding Interview" and "Programming Interviews Exposed"
- I don't know how important this is (you can do your own research) but here is an article on making your resume ATS Compliant:
- "This Is What A GOOD Resume Should Look Like" by Gayle McDowell (author of Cracking the Coding Interview),
- Note by the author: "This is for a US-focused resume. CVs for India and other countries have different expectations, although many of the points will be the same."
- "Step-by-step resume guide" by Tech Interview Handbook
- Detailed guide on how to set up your resume from scratch, write effective resume content, optimize it, and test your resume
- How to Pass the Engineering Interview in 2021
- Demystifying Tech Recruiting
- How to Get a Job at the Big 4:
- Cracking The Coding Interview Set 1:
- Cracking the Facebook Coding Interview:
- Prep Courses:
- Software Engineer Interview Unleashed (paid course):
- Learn how to make yourself ready for software engineer interviews from a former Google interviewer.
- Python for Data Structures, Algorithms, and Interviews (paid course):
- A Python centric interview prep course which covers data structures, algorithms, mock interviews and much more.
- Intro to Data Structures and Algorithms using Python (Udacity free course):
- A free Python centric data structures and algorithms course.
- Data Structures and Algorithms Nanodegree! (Udacity paid Nanodegree):
- Get hands-on practice with over 100 data structures and algorithm exercises and guidance from a dedicated mentor to help prepare you for interviews and on-the-job scenarios.
- Grokking the Behavioral Interview (Educative free course):
- Many times, it’s not your technical competency that holds you back from landing your dream job, it’s how you perform on the behavioral interview.
- Software Engineer Interview Unleashed (paid course):
Mock Interviews:
- Gainlo.co: Mock interviewers from big companies - I used this and it helped me relax for the phone screen and on-site interview
- Pramp: Mock interviews from/with peers - peer-to-peer model of practice interviews
- interviewing.io: Practice mock interview with senior engineers - anonymous algorithmic/systems design interviews with senior engineers from FAANG anonymously
Think of about 20 interview questions you'll get, along with the lines of the items below. Have at least one answer for each. Have a story, not just data, about something you accomplished.
-
Why do you want this job?
-
What's a tough problem you've solved?
-
Biggest challenges faced?
-
Best/worst designs seen?
-
Ideas for improving an existing product
-
How do you work best, as an individual and as part of a team?
-
Which of your skills or experiences would be assets in the role and why?
-
What did you most enjoy at [job x / project y]?
-
What was the biggest challenge you faced at [job x / project y]?
-
What was the hardest bug you faced at [job x / project y]?
-
What did you learn at [job x / project y]?
-
What would you have done better at [job x / project y]?
-
If you find it hard to come up with good answers of these types of interview questions, here are some ideas:
Some of mine (I already may know the answers, but want their opinion or team perspective):
- How large is your team?
- What does your dev cycle look like? Do you do waterfall/sprints/agile?
- Are rushes to deadlines common? Or is there flexibility?
- How are decisions made in your team?
- How many meetings do you have per week?
- Do you feel your work environment helps you concentrate?
- What are you working on?
- What do you like about it?
- What is the work life like?
- How is the work/life balance?
Congratulations!
Keep learning.
You're never really done.
*****************************************************************************************************
*****************************************************************************************************
Everything below this point is optional. It is NOT needed for an entry-level interview.
However, by studying these, you'll get greater exposure to more CS concepts, and will be better prepared for
any software engineering job. You'll be a much more well-rounded software engineer.
*****************************************************************************************************
*****************************************************************************************************
These are here so you can dive into a topic you find interesting.
- The Unix Programming Environment
- An oldie but a goodie
- The Linux Command Line: A Complete Introduction
- A modern option
- TCP/IP Illustrated Series
- Head First Design Patterns
- A gentle introduction to design patterns
- Design Patterns: Elements of Reusable Object-Oriented Software
- AKA the "Gang Of Four" book, or GOF
- The canonical design patterns book
- Algorithm Design Manual (Skiena)
- As a review and problem recognition
- The algorithm catalog portion is well beyond the scope of difficulty you'll get in an interview
- This book has 2 parts:
- Class textbook on data structures and algorithms
- Pros:
- Is a good review as any algorithms textbook would be
- Nice stories from his experiences solving problems in industry and academia
- Code examples in C
- Cons:
- Can be as dense or impenetrable as CLRS, and in some cases, CLRS may be a better alternative for some subjects
- Chapters 7, 8, 9 can be painful to try to follow, as some items are not explained well or require more brain than I have
- Don't get me wrong: I like Skiena, his teaching style, and mannerisms, but I may not be Stony Brook material
- Pros:
- Algorithm catalog:
- This is the real reason you buy this book.
- This book is better as an algorithm reference, and not something you read cover to cover.
- Class textbook on data structures and algorithms
- Can rent it on Kindle
- Answers:
- Errata
- Write Great Code: Volume 1: Understanding the Machine
- The book was published in 2004, and is somewhat outdated, but it's a terrific resource for understanding a computer in brief
- The author invented HLA, so take mentions and examples in HLA with a grain of salt. Not widely used, but decent examples of what assembly looks like
- These chapters are worth the read to give you a nice foundation:
- Chapter 2 - Numeric Representation
- Chapter 3 - Binary Arithmetic and Bit Operations
- Chapter 4 - Floating-Point Representation
- Chapter 5 - Character Representation
- Chapter 6 - Memory Organization and Access
- Chapter 7 - Composite Data Types and Memory Objects
- Chapter 9 - CPU Architecture
- Chapter 10 - Instruction Set Architecture
- Chapter 11 - Memory Architecture and Organization
- Introduction to Algorithms
- Important: Reading this book will only have limited value. This book is a great review of algorithms and data structures, but won't teach you how to write good code. You have to be able to code a decent solution efficiently
- AKA CLR, sometimes CLRS, because Stein was late to the game
- Computer Architecture, Sixth Edition: A Quantitative Approach
- For a richer, more up-to-date (2017), but longer treatment
You can expect system design questions if you have 4+ years of experience.
- Scalability and System Design are very large topics with many topics and resources, since there is a lot to consider when designing a software/hardware system that can scale. Expect to spend quite a bit of time on this
- Considerations:
- Scalability
- Distill large data sets to single values
- Transform one data set to another
- Handling obscenely large amounts of data
- System design
- features sets
- interfaces
- class hierarchies
- designing a system under certain constraints
- simplicity and robustness
- tradeoffs
- performance analysis and optimization
- Scalability
- START HERE: The System Design Primer
- System Design from HiredInTech
- How Do I Prepare To Answer Design Questions In A Technical Interview?
- 8 Things You Need to Know Before a System Design Interview
- Database Normalization - 1NF, 2NF, 3NF and 4NF (Video in Inglese)
- System Design Interview - There are a lot of resources in this one. Look through the articles and examples. I put some of them below
- How to ace a systems design interview
- Numbers Everyone Should Know
- How long does it take to make a context switch?
- Transactions Across Datacenters (Video in Inglese)
- A plain English introduction to CAP Theorem
- MIT 6.824: Distributed Systems, Spring 2020 (20 video)
- Consensus Algorithms:
- Consistent Hashing
- NoSQL Patterns
- Scalability:
- You don't need all of these. Just pick a few that interest you.
- Great overview (Video in Inglese)
- Short series:
- Scalable Web Architecture and Distributed Systems
- Fallacies of Distributed Computing Explained
- Jeff Dean - Building Software Systems At Google and Lessons Learned (Video in Inglese)
- Introduction to Architecting Systems for Scale
- Scaling mobile games to a global audience using App Engine and Cloud Datastore (Video in Inglese)
- How Google Does Planet-Scale Engineering for Planet-Scale Infra (Video in Inglese)
- The Importance of Algorithms
- Sharding
- Engineering for the Long Game - Astrid Atkinson Keynote(Video in Inglese)
- 7 Years Of YouTube Scalability Lessons In 30 Minutes
- How PayPal Scaled To Billions Of Transactions Daily Using Just 8VMs
- How to Remove Duplicates in Large Datasets
- A look inside Etsy's scale and engineering culture with Jon Cowie (Video in Inglese)
- What Led Amazon to its Own Microservices Architecture
- To Compress Or Not To Compress, That Was Uber's Question
- When Should Approximate Query Processing Be Used?
- Google's Transition From Single Datacenter, To Failover, To A Native Multihomed Architecture
- The Image Optimization Technology That Serves Millions Of Requests Per Day
- A Patreon Architecture Short
- Tinder: How Does One Of The Largest Recommendation Engines Decide Who You'll See Next?
- Design Of A Modern Cache
- Live Video Streaming At Facebook Scale
- A Beginner's Guide To Scaling To 11 Million+ Users On Amazon's AWS
- A 360 Degree View Of The Entire Netflix Stack
- Latency Is Everywhere And It Costs You Sales - How To Crush It
- What Powers Instagram: Hundreds of Instances, Dozens of Technologies
- Salesforce Architecture - How They Handle 1.3 Billion Transactions A Day
- ESPN's Architecture At Scale - Operating At 100,000 Duh Nuh Nuhs Per Second
- See "Messaging, Serialization, and Queueing Systems" way below for info on some of the technologies that can glue services together
- Twitter:
- For even more, see "Mining Massive Datasets" video series in the Video Series section
- Practicing the system design process: Here are some ideas to try working through on paper, each with some documentation on how it was handled in the real world:
- review: The System Design Primer
- System Design from HiredInTech
- cheat sheet
- flow:
- Understand the problem and scope:
- Define the use cases, with interviewer's help
- Suggest additional features
- Remove items that interviewer deems out of scope
- Assume high availability is required, add as a use case
- Think about constraints:
- Ask how many requests per month
- Ask how many requests per second (they may volunteer it or make you do the math)
- Estimate reads vs. writes percentage
- Keep 80/20 rule in mind when estimating
- How much data written per second
- Total storage required over 5 years
- How much data read per second
- Abstract design:
- Layers (service, data, caching)
- Infrastructure: load balancing, messaging
- Rough overview of any key algorithm that drives the service
- Consider bottlenecks and determine solutions
- Understand the problem and scope:
- Exercises:
I added them to help you become a well-rounded software engineer, and to be aware of certain
technologies and algorithms, so you'll have a bigger toolbox.
-
- Familiarize yourself with a unix-based code editor
- vi(m):
- emacs:
- The Absolute Beginner's Guide to Emacs (video by David Wilson)
- The Absolute Beginner's Guide to Emacs (notes by David Wilson)
-
- Khan Academy
- More about Markov processes:
- See more in MIT 6.050J Information and Entropy series below
-
- Intro
- Parity
- Hamming Code:
- Error Checking
-
- Also see video below
- Make sure to watch information theory video first
- Information Theory, Claude Shannon, Entropy, Redundancy, Data Compression & Bits (Video in Inglese)
-
- Also see video below
- Make sure to watch information theory video first
- Khan Academy Series
- Cryptography: Hash Functions
- Cryptography: Encryption
-
- Make sure to watch information theory video first
- Computerphile (video):
- Compressor Head video
- (optional) Google Developers Live: GZIP is not enough!
-
- Given a Bloom filter with m bits and k hashing functions, both insertion and membership testing are O(k)
- Bloom Filters (Video in Inglese)
- Bloom Filters | Mining of Massive Datasets | Stanford University (Video in Inglese)
- Tutorial
- How To Write A Bloom Filter App
-
- Used to determine the similarity of documents
- The opposite of MD5 or SHA which are used to determine if 2 documents/strings are exactly the same
- Simhashing (hopefully) made simple
-
-
Know at least one type of balanced binary tree (and know how it's implemented):
-
"Among balanced search trees, AVL and 2/3 trees are now passé, and red-black trees seem to be more popular. A particularly interesting self-organizing data structure is the splay tree, which uses rotations to move any accessed key to the root." - Skiena
-
Of these, I chose to implement a splay tree. From what I've read, you won't implement a balanced search tree in your interview. But I wanted exposure to coding one up and let's face it, splay trees are the bee's knees. I did read a lot of red-black tree code
- Splay tree: insert, search, delete functions If you end up implementing red/black tree try just these:
- Search and insertion functions, skipping delete
-
I want to learn more about B-Tree since it's used so widely with very large data sets
-
AVL trees
- In practice: From what I can tell, these aren't used much in practice, but I could see where they would be: The AVL tree is another structure supporting O(log n) search, insertion, and removal. It is more rigidly balanced than red–black trees, leading to slower insertion and removal but faster retrieval. This makes it attractive for data structures that may be built once and loaded without reconstruction, such as language dictionaries (or program dictionaries, such as the opcodes of an assembler or interpreter)
- MIT AVL Trees / AVL Sort (Video in Inglese)
- AVL Trees (Video in Inglese)
- AVL Tree Implementation (Video in Inglese)
- Split And Merge
-
Splay trees
- In practice: Splay trees are typically used in the implementation of caches, memory allocators, routers, garbage collectors, data compression, ropes (replacement of string used for long text strings), in Windows NT (in the virtual memory, networking and file system code) etc
- CS 61B: Splay Trees (Video in Inglese)
- MIT Lezione: Splay Trees:
- Gets very mathy, but watch the last 10 minutes for sure.
- Video
-
Red/black trees
- These are a translation of a 2-3 tree (see below).
- In practice: Red–black trees offer worst-case guarantees for insertion time, deletion time, and search time. Not only does this make them valuable in time-sensitive applications such as real-time applications, but it makes them valuable building blocks in other data structures which provide worst-case guarantees; for example, many data structures used in computational geometry can be based on red–black trees, and the Completely Fair Scheduler used in current Linux kernels uses red–black trees. In the version 8 of Java, the Collection HashMap has been modified such that instead of using a LinkedList to store identical elements with poor hashcodes, a Red-Black tree is used
- Aduni - Algorithms - Lezione 4 (link jumps to starting point) (Video in Inglese)
- Aduni - Algorithms - Lezione 5 (Video in Inglese)
- Red-Black Tree
- An Introduction To Binary Search And Red Black Tree
- [Review] Red-Black Trees (playlist) in 30 minutes (video)
-
2-3 search trees
- In practice: 2-3 trees have faster inserts at the expense of slower searches (since height is more compared to AVL trees).
- You would use 2-3 tree very rarely because its implementation involves different types of nodes. Instead, people use Red Black trees.
- 23-Tree Intuition and Definition (Video in Inglese)
- Binary View of 23-Tree
- 2-3 Trees (student recitation) (Video in Inglese)
-
2-3-4 Trees (aka 2-4 trees)
- In practice: For every 2-4 tree, there are corresponding red–black trees with data elements in the same order. The insertion and deletion operations on 2-4 trees are also equivalent to color-flipping and rotations in red–black trees. This makes 2-4 trees an important tool for understanding the logic behind red–black trees, and this is why many introductory algorithm texts introduce 2-4 trees just before red–black trees, even though 2-4 trees are not often used in practice.
- CS 61B Lezione 26: Balanced Search Trees (Video in Inglese)
- Bottom Up 234-Trees (Video in Inglese)
- Top Down 234-Trees (Video in Inglese)
-
N-ary (K-ary, M-ary) trees
- note: the N or K is the branching factor (max branches)
- binary trees are a 2-ary tree, with branching factor = 2
- 2-3 trees are 3-ary
- K-Ary Tree
-
B-Trees
- Fun fact: it's a mystery, but the B could stand for Boeing, Balanced, or Bayer (co-inventor).
- In Practice: B-Trees are widely used in databases. Most modern filesystems use B-trees (or Variants). In addition to its use in databases, the B-tree is also used in filesystems to allow quick random access to an arbitrary block in a particular file. The basic problem is turning the file block i address into a disk block (or perhaps to a cylinder-head-sector) address
- B-Tree
- B-Tree Datastructure
- Introduction to B-Trees (Video in Inglese)
- B-Tree Definition and Insertion (Video in Inglese)
- B-Tree Deletion (Video in Inglese)
- MIT 6.851 - Memory Hierarchy Models (Video in Inglese) - covers cache-oblivious B-Trees, very interesting data structures - the first 37 minutes are very technical, may be skipped (B is block size, cache line size)
- [Review] B-Trees (playlist) in 26 minutes (video)
-
-
- Great for finding number of points in a rectangle or higher dimension object
- A good fit for k-nearest neighbors
- kNN K-d tree algorithm (Video in Inglese)
-
- "These are somewhat of a cult data structure" - Skiena
- Randomization: Skip Lists (Video in Inglese)
- For animations and a little more detail
-
- Combination of a binary search tree and a heap
- Treap
- Data Structures: Treaps explained (Video in Inglese)
- Applications in set operations
-
- Why ML?
- Google's Cloud Machine learning tools (Video in Inglese)
- Google Developers' Machine Learning Recipes (Scikit Learn & Tensorflow) (Video in Inglese)
- Tensorflow (Video in Inglese)
- Tensorflow Tutorials
- Practical Guide to implementing Neural Networks in Python (using Theano)
- Courses:
- Great starter course: Machine Learning - video only - see video 12-18 for a review of linear algebra (14 and 15 are duplicates)
- Google's Deep Learning Nanodegree
- AWS Machine Learning Engineer Nanodegree
- Self-Driving Car Engineer Nanodegree
- Resources:
I added these to reinforce some ideas already presented above, but didn't want to include them
above because it's just too much. It's easy to overdo it on a subject.
You want to get hired in this century, right?
-
SOLID
- Bob Martin SOLID Principles of Object Oriented and Agile Design (Video in Inglese)
- S - Single Responsibility Principle | Single responsibility to each Object
- O - Open/Closed Principle | On production level Objects are ready for extension but not for modification
- L - Liskov Substitution Principle | Base Class and Derived class follow ‘IS A’ Principle
- I - Interface segregation principle | clients should not be forced to implement interfaces they don't use
- D -Dependency Inversion principle | Reduce the dependency In composition of objects.
-
Union-Find
-
More Dynamic Programming (video)
- 6.006: Dynamic Programming I: Fibonacci, Shortest Paths
- 6.006: Dynamic Programming II: Text Justification, Blackjack
- 6.006: DP III: Parenthesization, Edit Distance, Knapsack
- 6.006: DP IV: Guitar Fingering, Tetris, Super Mario Bros.
- 6.046: Dynamic Programming & Advanced DP
- 6.046: Dynamic Programming: All-Pairs Shortest Paths
- 6.046: Dynamic Programming (student recitation)
-
Advanced Graph Processing (video)
-
MIT Probability (mathy, and go slowly, which is good for mathy things) (video):
-
String Matching
- Rabin-Karp (video):
- Knuth-Morris-Pratt (KMP):
- Boyer–Moore string search algorithm
- Coursera: Algorithms on Strings
- starts off great, but by the time it gets past KMP it gets more complicated than it needs to be
- nice explanation of tries
- can be skipped
-
Sorting
- Stanford Lezioni on sorting:
- Shai Simonson, Aduni.org:
- Steven Skiena Lezioni on sorting:
Sit back and enjoy.
-
List of individual Dynamic Programming problems (each is short)
-
Excellent - MIT Calculus Revisited: Single Variable Calculus
-
Skiena Lezioni from Algorithm Design Manual - CSE373 2020 - Analysis of Algorithms (26 video)
-
MIT 6.042J: Mathematics for Computer Science, Fall 2010 (25 video)
- Love classic papers?
- 1978: Communicating Sequential Processes
- 2003: The Google File System
- replaced by Colossus in 2012
- 2004: MapReduce: Simplified Data Processing on Large Clusters
- mostly replaced by Cloud Dataflow?
- 2006: Bigtable: A Distributed Storage System for Structured Data
- 2006: The Chubby Lock Service for Loosely-Coupled Distributed Systems
- 2007: Dynamo: Amazon’s Highly Available Key-value Store
- The Dynamo paper kicked off the NoSQL revolution
- 2007: What Every Programmer Should Know About Memory (very long, and the author encourages skipping of some sections)
- 2012: AddressSanitizer: A Fast Address Sanity Checker:
- 2013: Spanner: Google’s Globally-Distributed Database:
- 2014: Machine Learning: The High-Interest Credit Card of Technical Debt
- 2015: Continuous Pipelines at Google
- 2015: High-Availability at Massive Scale: Building Google’s Data Infrastructure for Ads
- 2015: TensorFlow: Large-Scale Machine Learning on Heterogeneous Distributed Systems
- 2015: How Developers Search for Code: A Case Study
- More papers: 1,000 papers