40k+ downloads on Infoscience: Top 10

I wrote yesterday about my accepted author manuscript being downloaded more than 1000 times. I have 41 other documents available on Infoscience, including papers, presentations and posters. They have been downloaded more than 40'000 times. This is a lower bound, since all these documents are also available on the TRANSP-OR website.

Here is my Top 10 downloads on Infoscience:

A. Danalet, M. Bierlaire and M. Sorci (Dirs.). Modèles de choix discrets pour la reconnaissance des expressions faciales statiques. 2007.
M. Bierlaire, A. Curchod, A. Danalet, E. Doyen and P. Faure et al. Projet de recherche sur la mobilité combinée, Rapport définitif de l'enquête de préférences révélées, 2011.
M. Schuler, P. Faure, S. Munafò, A. Danalet and P. Dessemontet. Amélioration de la qualité de service et évolution de la fréquentation de CarPostal, 2012.
A. Danalet and S. Sahaleh. Projet de recherche sur la mobilité combinée : Rapport de l'enquête de préférences déclarées, 2012.
S. Sahaleh, M. Bierlaire, B. Farooq, A. Danalet and F. Hänseler. Scenario Analysis of Pedestrian Flow in Public Spaces. 12th Swiss Transport Research Conference, Monte Verità, Ascona, Switzerland, May 2-4.
A. Danalet. Optima: When flexible transport is able to meet a dispersed demand through the whole territory. ENAC Research Day 2011, EPFL, June 8, 2011.
A. Danalet and P. Faure. Optima: When flexible transport is able to meet a dispersed demand throughout the whole territory. Marché de la recherche regiosuisse & Colloque sur le développement régional 2011, EPFL, September 1, 2011.
M. Schuler, P. Faure, S. Munafò, A. Danalet and P. Dessemontet. Projektstudie über den kombinierten Verkehr : Verbesserung der Dienstleistungsqualität und Entwicklung der Fahrgastzahlen bei PostAuto, 2012.
A. Danalet, B. Farooq and M. Bierlaire. A Bayesian Approach to Detect Pedestrian Destination-Sequences from WiFi Signatures, in Transportation Research Part C: Emerging Technologies, vol. 44, p. 146 - 170, 2014.
A. Danalet, B. Farooq and M. Bierlaire. Estimating Pedestrian Activities from Digital Footprints. Latsis Symposium 2012: 1st European Symposium on Quantitative Methods in Transportation Systems, Lausanne, Switzerland, September 05, 2012.
Top 10 since 6.12.2007, based on Infoscience's Dashboard.

1000+ downloads for accepted author manuscript

In July 2014, we published a paper in Transportation Research Part C (online since May 2014). This journal allows to archive a post-print (i.e., final draft post-refereeing) (but not the publisher's version/PDF), which is called by Elsevier the "accepted author manuscript". In September 2014, we published an accepted author manuscript as a PDF and last week as an eboook, both on Infoscience, the institutional archive of the EPFL.

This accepted author manuscript has been downloaded more than 1000 times on Infoscience. Since the ebook was only published last week, these 1000 downloads are due to the PDF version only. Research data were published on Infoscience in March 2015, and it is not clear if the 1000 downloads are related to the accepted author manuscript or to the research data. However, it seems more reasonable that people end up on Infoscience by looking for keywords associated to the author manuscript than to the research data.

As a comparison, the publisher version was downloaded 1000 times by April 2015. The number of downloads is of the same order of magnitude and we can say that publishing the accepted author manuscript roughly doubles the number of downloads.

Technical report as ebook

After submitting an ebook for the author's manuscript of a paper, we publish an ebook for our recent technical report "Location choice with longitudinal WiFi data" in .mobi format.

Negative cost of walking

Compared to driving or using public transport, walking is usually considered as not related to cost. In mode choice models, cost is an attribute of the alternative for car and public transport, but not for soft modes, where the main attribute of the choice is the distance (or in French here).

It might change with the introduction of bitwalking. "Bitwalking dollars will be earned by walking, unlike other digital currencies such as Bitcoins that are "mined" by computers", as BBC introduces it. The more you walk, the more you earn money. It creates a negative cost to walking. The goals are to sell the data, promote healthy behavior and "transform lives" in "poorer countries".

For Evgeny Morozov, it is another example of the "financialization of everyday life, the "let's keep fit" edition". While the marketing, healthy and "humanitarian" objectives could be put into question, giving money to pedestrians (a negative cost) could still be an interesting demand management strategy for congested pedestrian facilities, such as train stations, airports, or supermarkets.

Imagine that your train station is full during the morning peak hour for 30 minutes. Using the WiFi, you could offer a free coffee to people using the train station before or after the peak. By smoothing the peak, you increase the efficiency of the train station: those who are flexible about their travel time will move and receive coffee; those who are not flexible will enjoy a less congested train station.

It's surely cheaper than modifying the train station infrastructure, at least in the short term.

Défense de thèse - changement de salle

Ma défense de thèse aura lieu en CO2 (et non en GC C3 30 comme initalement annoncé).

Pour vous y rendre depuis l'arrêt de métro EPFL, suivez ce plan.

Pour vous y rendre en voiture, le parking le plus proche est le parking de l'Esplanade.

Author's version as ebook

With Bilal Farooq and Michel Bierlaire, we published a paper in Transportation Research Part C in 2014 (doi:10.1016/j.trc.2014.03.015). Then, we also published research data associated with this paper (doi:10.5281/zenodo.8492) and the post-print (or "author's manuscript), i.e., the final draft post-refereeing, freely available on Infoscience even if you don't have access to Transportation Research Part C (direct link).

Today we publish an ebook of the post-print on Infoscience. It is a .mobi file that you can read on your Kindle or any other e-book reader you prefer (direct link).

Location choice with longitudinal WiFi data

A new technical report is available on TRANSP-OR website and on Infoscience:

Location choice with longitudinal WiFi data


While moving from diary survey to location-aware technologies, recent data collection techniques provide new insights about location choices. Only few dynamic models of location choice exist in the literature, and none of them to our knowledge correct for serial correlation. In this paper, we apply a method proposed by Wooldridge (2005) to deal with the initial values problem on the choice of catering locations on a campus using WiFi traces. Cross-validation, price elasticity and simulation of a scenario predicting the opening of a new catering location are presented. Predicted market shares of the new catering location correspond to point-of-sale data of the first week of opening.


  • Dynamic model of location choice using panel data
  • Correcting for endogeneity due to lagged dependent variable and agent effect
  • Case study: catering location choice using WiFi traces
  • Cross-validation, price elasticity, predicted market shares

It can be downloaded on TRANSP-OR website and on Infoscience, including an ebook (.mobi) format.

Danalet, A., Tinguely, L., de Lapparent, M., and Bierlaire, M. (2015). Location choice with longitudinal WiFi data. Technical report TRANSP-OR 151110. Transport and Mobility Laboratory, ENAC, EPFL. [Bibtex][Download PDF]

The research data used for this paper are freely available on Zenodo:

Danalet, Antonin et al.. (2015). Location choice with longitudinal WiFi data: Research Data. Zenodo. DOI: 10.5281/zenodo.33973

This document describes the softwares, data, models and raw results associated to the technical report. This work is licensed under the Creative Commons Attribution-NonCommercial (CC BY-NC). You are free to share, use and remix the data associated to this document, but not for commercial purposes. When you share, use and remix the data, please mention our technical report.

Cafés scientifiques "Big Data" - 18.11 - unine

Je participerai à un café scientifique sur le "big data" le mercredi 18 novembre à l'Université de Neuchâtel, de 18h à 19h30 :

Pas si "bad", le "Big data"

Le « Big Data » est communément associé à l’exploitation de volumes massifs de données que nous générons, souvent à notre insu. En utilisant son téléphone mobile, en communiquant sur les réseaux sociaux, en questionnant des moteurs de recherche, ou encore en faisant des achats en ligne. Les objets que nous manipulons (véhicules, appareils électroménagers, cartes à puce, etc.) produisent aussi de nombreuses données exploitables. Si les craintes d’atteinte à la vie privée donnent une connotation négative au concept de « Big Data », celui-ci présente aussi des aspects positifs. Par exemple en épidémiologie pour traquer des virus, ou en urbanisme pour améliorer le fonctionnement des villes (« smart cities »). Et si le « Big Data » cachait plus de bons côtés qu’il n’en a l’air ?

Intervenants :

- Amos Bairoch, professeur au Swiss Institute of Bioinformatics et à l’Université de Genève
- Pascal Felber, professeur à l’Institut d’informatique, UniNE
- Olivier Ribaux, professeur à l’Ecole des sciences criminelles, UniL
- Kilian Stoffel, professeur à l’Institut de management de l’information, UniNE
- et moi

A la cafétéria du bâtiment principal de l'Université, Av. du 1er-Mars 26, Neuchâtel.

My experience of collaborative writing

EPFL Library offers courses for PhD students about literature search, the publication process and plagiarism: From Research to Publication. Module 2, Empower your writing process, covers scientific writing, including copyright, collaborative work and publication visibility.

As a guest speaker in this module, I presented my experience regarding collaborative writing. Slides are available on EPFL Library website and on TRANSP-OR website.

Meanwhile on Twitter (it's almost collaborative writing...):

Soutenance publique de thèse

La soutenance publique de ma thèse, intitulée Activity choice modeling for pedestrian facilities, aura lieu le vendredi 4 décembre à 18h, en CO2. La présentation sera en français (même si le titre officiel est en anglais).

Activity choice modeling for pedestrian facilities - Résumé en français

Cette thèse développe des modèles de choix d'activité et de destination pour les infrastructures piétonnes à partir de traces WiFi. L'analyse de la demande en transport basée sur l'activité, initialement développée pour la mobilité urbaine, est ici adaptée aux piétons et aux empreintes numériques des téléphones portables. Nous nous intéressons à la compréhension des séquences d'épisodes d'activité d'un piéton en utilisant les modèles de choix discret et les données de localisation des antennes de communication.

Les modèles de choix d'activité et de destination sont nécessaires aux infrastructures piétonnes, en particulier pour les pôles d'échanges multimodaux comme les gares ou les aéroports, afin d'aider à la décision lors de la construction de nouvelles infrastructures, lors de la modification de structures existantes, ou pour le choix du positionnement de certains points d'intérêt tels que les distributeurs à billets dans les gares. Mieux comprendre la demande pour les différentes activités disponibles est particulièrement important face à l'augmentation du nombre de visiteurs ou lors du développement de nouvelles activités, telles que l'ouverture d'un magasin ou d'un lieu de restauration.

Les données issues de capteurs existants, tels que les antennes WiFi, sont bon marché et couvrent des infrastructures entières, mais elles sont imprécises et dépourvues de la sémantique permettant de décrire les mouvements, les arrêts, les destinations et les activités effectuées à destination. Dès lors, comprendre les comportements piétons nécessite tout d'abord d'observer le comportement réel et de détecter les arrêts aux destinations, et seulement ensuite de modéliser le comportement.

La première partie de cette thèse se focalise sur la détection des séquences d'épisodes d'activité. Nous y développons une approche bayésienne pour fusionner des données de localisation brutes avec d'autres sources de données de manière à prendre en compte l'imprécision de la localisation et à décrire les séquences d'épisodes d'activité. Cette approche génère plusieurs séquences d'épisodes pour un individu. Chacune d'entre elles est associée à la probabilité d'être la vraie séquence, effectivement effectuée par l'individu. L'approche s'appuie sur une équation de mesure et une distribution de probabilité a priori. L'équation de mesure exprime l'imprécision du capteur. La distribution a priori représente l'attractivité des différents points d'intérêt dans le voisinage de la mesure et permet l'utilisation d'information a priori à partir d'autres sources de données (données de registres, données de points de vente, capteurs de comptage, etc.).

La deuxième partie de cette thèse propose des modèles pour les choix d'activité et de destination. Le choix commun du type d'activité et du timing des activités est modélisé avec une approche dite "du chemin d'activité". La séquence d'épisodes d'activité est vue comme un chemin dans un réseau d'activité. Le temps est considéré comme discret. Contrairement aux modèles traditionnels, notre modèle n'est pas basé sur la notion de tour, commençant et terminant au domicile, puisque le domicile comme activité quotidienne n'a pas de sens dans notre contexte. L'ensemble de choix contient toutes les combinaisons de types d'activité et d'intervalles de temps. Le nombre de chemins d'activité différents est par conséquent très élevé (augmentant avec la résolution temporelle et la désagrégation des types d'activité). Inspirés par les modèles de choix d'itinéraire, nous utilisons un algorithme de Metropolis-Hastings pour échantillonner des chemins, générant ainsi l'ensemble de choix. Une correction de l'utilité liée à l'échantillonnage préférentiel permet d'estimer des paramètres du modèle non biaisés sans énumérer l'ensemble de choix complet.

Alors que le modèle de chemin d'activité décrit le choix d'un type d'activité dans le temps, la destination où cette activité a lieu est modélisée à l'aide d'un modèle de choix de destination conditionnel au type d'activité. Notre approche prend en compte la nature de panel des données et gère l'autocorrélation entre les termes d'erreur.

En utilisant des données WiFi réelles collectées sur le campus de l'EPFL, nous estimons un modèle de choix de chemin d'activité qui montre un effet de satiété, un effet d'aversion au retard lié aux heures de cours, une préférence pour une activité principale, une préférence pour l'heure de la journée et une préférence pour certains profils d'activité (c'est-à-dire la préférence pour un ordre dans lequel réaliser les activités).

Nous développons aussi un modèle de choix de destination pour un type d'activité spécifique : manger. Sachant que l'individu a décidé de manger, quel restaurant choisit-il ? Ce modèle de choix de destination conditionnel inclut dans sa fonction d'utilité le coût des menus, le type de nourriture et de boisson proposées, la visibilité du restaurant, la distance à partir de l'épisode d'activité précédent, les caractéristiques socioéconomiques et les habitudes.

Cette thèse propose un ensemble de méthodologies rigoureuses pour détecter, modéliser et prédire les choix d'activité et de destination des piétons dans les infrastructures qui leur sont dédiées, en utilisant des données de capteurs. Une démonstration de faisabilité a été développée sur le campus en utilisant des données réelles. Nos méthodologies d'aide à la décision aideront les opérateurs des pôles d'échanges multimodaux à optimiser la localisation des différents points d'intérêt (tels que distributeurs à billets, toilettes ou magasins), à définir les heures d'ouverture ou les horaires de train, et à trouver un équilibre entre les différents types d'usagers (voyageurs ou personnes qui font leurs courses).

