eBook - ePub

L'arte della statistica

Name: L'arte della statistica
Author: David Spiegelhalter, Daniele A. Gewurz, Luisa Doplicher

Cosa ci insegnano i dati

David Spiegelhalter, Daniele A. Gewurz, Luisa Doplicher

Share book

344 pages
Italian
ePUB (mobile friendly)
Available on iOS & Android

eBook - ePub

L'arte della statistica

Cosa ci insegnano i dati

David Spiegelhalter, Daniele A. Gewurz, Luisa Doplicher

Book details

Book preview

Table of contents

Citations

About This Book

Nei secoli la statistica ha svolto un ruolo di primo piano nella comprensione scientifica del mondo, e quotidianamente ognuno di noi sperimenta in quali innumerevoli modi le affermazioni statistiche determinano la nostra vita o vengono abilmente sfruttate da parte dei media e dei centri di potere. Nell'era in cui i big data si affermano come disciplina fondamentale del mondo dell'economia, della finanza e in tutti gli aspetti della vita politica e sociale, essere consapevoli delle basi della statistica è piú importante che mai. Con questo libro, semplice e autorevole insieme, David Spiegelhalter guida il lettore attraverso i principî essenziali di un universo fondamentale quanto sconosciuto. Partendo da casi particolari della vita di tutti i giorni per introdurre ai concetti generali, Spiegelhalter ci mostra quanto la statistica possa contribuire per esempio a catturare un serial killer prima che colpisca ancora o a individuare il passeggero piú fortunato del Titanic o a capire quanto uno screening medico sia veramente necessario. E poi, quanti alberi ci sono sul pianeta? Davvero gli ospedali con piú pazienti hanno tassi di sopravvivenza piú alti?

Frequently asked questions

How do I cancel my subscription?

Simply head over to the account section in settings and click on “Cancel Subscription” - it’s as simple as that. After you cancel, your membership will stay active for the remainder of the time you’ve paid for. Learn more here.

Can/how do I download books?

At the moment all of our mobile-responsive ePub books are available to download via the app. Most of our PDFs are also available to download and we're working on making the final remaining ones downloadable now. Learn more here.

What is the difference between the pricing plans?

Both plans give you full access to the library and all of Perlego’s features. The only differences are the price and subscription period: With the annual plan you’ll save around 30% compared to 12 months on the monthly plan.

What is Perlego?

We are an online textbook subscription service, where you can get access to an entire online library for less than the price of a single book per month. With over 1 million books across 1000+ topics, we’ve got you covered! Learn more here.

Do you support text-to-speech?

Look out for the read-aloud symbol on your next book to see if you can listen to it. The read-aloud tool reads text aloud for you, highlighting the text as it is being read. You can pause it, speed it up and slow it down. Learn more here.

Is L'arte della statistica an online PDF/ePUB?

Yes, you can access L'arte della statistica by David Spiegelhalter, Daniele A. Gewurz, Luisa Doplicher in PDF and/or ePUB format, as well as other popular books in Matematica & Probabilità e statistica. We have over one million books available in our catalogue for you to explore.

Information

Publisher

EINAUDI

Year

2020

ISBN

9788858435021

Topic

Matematica

Subtopic

Probabilità e statistica

albero decisionale o dendrogramma: forma di algoritmo di classificazione in cui si esaminano le caratteristiche una alla volta; la risposta determina la caratteristica da valutare in seguito, fino a ottenere la classificazione.

alfabetizzazione ai dati: comprensione dei principî che permettono di trarre insegnamenti dai dati, di sottoporli ad analisi elementari e di criticare la validità delle conclusioni stabilite in base ai dati.

algoritmo: regola o formula per trasformare le variabili d’ingresso in quelle di uscita, che possono essere previsioni, classificazioni o probabilità.

analisi e studi confermativi: studi rigorosi idealmente svolti secondo un protocollo prestabilito, per confermare o smentire le ipotesi sollevate dalle analisi e dagli studi esplorativi.

analisi e studi esplorativi: studi iniziali flessibili che permettono cambiamenti nella progettazione dello studio e nell’analisi per investigare filoni promettenti, e che sono destinati a generare ipotesi poi corroborate dagli studi confermativi.

analisi predittive: uso dei dati per creare algoritmi che realizzano previsioni.

apprendimento automatico: procedura che esamina dati complessi e formula algoritmi, per esempio di classificazione, previsione o raggruppamento.

apprendimento non supervisionato: identificazione delle classi basata su casi di appartenenza non prestabilita, tramite procedure di raggruppamento di qualche tipo.

apprendimento profondo / deep learning: tecnica di apprendimento automatico che parte dai tipici modelli di reti neurali artificiali e li generalizza a molti strati corrispondenti a vari livelli di astrazione, che vanno per esempio dai singoli pixel di un’immagine fino al riconoscimento di oggetti.

apprendimento supervisionato: costruzione di un algoritmo di classificazione basata su casi la cui appartenenza a certe classi è confermata.

bootstrap: metodo che genera gli intervalli di fiducia e la distribuzione degli indici statistici di verifica tramite il ricampionamento dei dati osservati, invece di ipotizzare un modello di probabilità per la variabile casuale. Un esempio elementare di ricampionamento bootstrap per un insieme di dati x₁, x₂, …, x_n è un campione di dimensioni n ottenuto estraendo i valori dall’insieme originario, con reimmissione; generalmente i valori vi compaiono con frequenze diverse rispetto all’insieme originario.

calibrazione: richiesta che le frequenze osservate degli eventi corrispondano a quelle derivate dalle previsioni probabilistiche. Per esempio, quando agli eventi si assegna una probabilità di 0,7, essi dovrebbero in effetti avvenire circa il 70% delle volte.

causalità inversa: si ha quando sulle prime il nesso tra due variabili sembra causale, ma potrebbe in realtà funzionare nella direzione opposta. Per esempio, gli astemi tendono ad avere peggiori condizioni di salute rispetto a chi beve moderatamente, ma il motivo è almeno in parte che i problemi di salute hanno spinto alcuni a smettere di bere.

coefficiente di regressione: in un modello statistico, parametro stimato che esprime l’entità del nesso tra una variabile esplicativa e un risultato dell’analisi di regressione multipla. Il coefficiente ha interpretazioni diverse a seconda se la variabile di risposta è continua (regressione lineare multipla), è una percentuale (regressione logistica), è un conteggio (regressione di Poisson) o un tempo di sopravvivenza (regressione di Cox).

comportamento induttivo: proposta elaborata negli anni Trenta da Jerzy Neyman ed Egon Pearson per formulare il test di ipotesi in termini del processo decisionale. Ne derivano le idee di dimensione, efficacia ed errori di primo e secondo tipo.

confondente: variabile associata sia a una variabile di risposta sia a una variabile predittiva e che può forse spiegarne in parte il nesso apparente. Per esempio, la statura e il peso dei bambini hanno una forte correlazione, in gran parte spiegata però dalla loro età.

controfattuale: scenario del tipo «e se», in cui si considera uno svolgimento alternativo degli eventi.

convalida incrociata: maniera di valutare la qualità di un algoritmo per le previsioni o le classificazioni eliminando sistematicamente alcuni casi, che vanno a comporre l’insieme di verifica.

correzione di Bonferroni: metodo per regolare la dimensione (errore di primo tipo) o gli intervalli di fiducia, consentendo il test simultaneo di molte ipotesi. In particolare, nel test di n ipotesi, per una dimensione globale (errore di primo tipo) pari ad α, ciascuna ipotesi è controllata con dimensione α/n. L’alternativa equivalente è specificare intervalli di fiducia del 100(1 – α/n)% per ogni quantità stimata. Per esempio, nel test di 10 ipotesi con un’α globale pari a 5%, i valori P sarebbero confrontati alla soglia di 0,05/10 = 0,005, e si userebbero gli intervalli di fiducia del 99...