Mirco Bartolozzi is the the founder of “F1DataAnalysis”, a favorite page of Formula 1 followers. He answered Muhammed Kaya’s questions from Medyascope Sport. What is data analysis, where to start, and what is the future of data analysis and statistics? You can find all the answers in our interview.
* Bu keyifli röportajın Türkçe çevirisini sayfanın altında okuyabilirsiniz.
Interview with Mirco Bartolozzi
Data analysis is an important tool that can pave the way building block paving the way to success in Formula 1. Formula 1 cars are designed in light of this datain the light of these data. It is the job of data analysts to process this data and make it useful.take this data in a healthy way and make it readable.
Dear Mirco Bartolozzi, one of the world famous names in the field of Formula 1 data analysis, we had a pleasant interview with @F1DataAnalysis, the name of the account you know.
- Mirco, let’s start by getting to know you first… Who is Mirco Bartolozzi in short?
Hello! First, thank you for being interested in my project. I’m a 27 years old Italian Engineer currently enrolled in the third and last year of a PhD program focusing on motorcycle dynamics. I’ve always been passionate about mechanics, the field of physics that studies the motion of bodies and its causes. This love evolved into an interest in vehicle dynamics, leading me to my Mechanical Engineering studies. After my Bachelor, I continued with a Masters in the same field, focusing on road vehicles. Starting from the last year of my Bachelor, I’ve been a member of the Suspension & Dynamics department of the Formula SAE team of my university for one year; then, I was promoted to chief of the department where I supervised the design, construction, assembly and setup of the car for two years. Currently, I’m an external supervisor for the team, guiding the students to ensure success in the competition. After the master’s, I decided to continue with a PhD program, where I’m researching motorcycle dynamics, with a particular focus on manoeuvrability, rider-vehicle interaction, and lateral dynamics.
- Could you tell your story of meeting Formula 1? How long have you been watching?
As a child, I remember watching some Formula 1 races as my grandad was a big Ferrari fan. Still, I did not follow the sport consistently at the time. The first season I followed race-after-race, keeping track of the standings, was in 2010. As a Ferrari supporter, I still remember the disappointment of Alonso being unable to overtake Petrov. After that year, I followed every season closely. I remember understanding the sport better year after year as I had more experience, especially as my studies began to intertwine with this sport.
- As far as I know, you are working on data analysis. Could you elaborate on these for us, please?
Even though I’m not a data analyst, I’ve always worked with data in my studies and my current research: data from simulations or experimental data from real vehicles. In particular, my work involves creating models, which are simplified representations of reality that should describe it. Once you have a model, which is basically a set of equations, you can use data to determine the model’s parameters: for example, two cars are essentially the same thing, but each one will have different parameters, like mass, power, and grip. In my research, I make assumptions based on what I see in the data and use the data themselves to evolve and validate my conclusions.
- So how did the idea of working on Formula 1’s data come about? Is this professional level?
I’ve always studied a lot on weekends during my Bachelor and Master, so when I started doing the PhD, I found having so much free time strange. I decided to use some of that time for something that I believed people, myself included, would have found interesting: the thing was highly appreciated, as you can see from the around 140.000 people following the page across social media after just one year. The time I devote to a single type of analysis is far less than what I would do for a scientific article; however, when I commit to the analysis, I do my best to represent the data most clearly and comprehensively. In particular, doing analyses full of in-depth information and presenting this information concisely was the key to being appreciated by both professional engineers and casual fans.
- What programs do you use to extract the data? Does it take a long time?
I use the FastF1 python package to extract the data. In these months, I’ve automated most of the process of creating analyses, from choosing the correct drivers and laps to plotting the results to storing them. However, managing this project takes me a lot of time, mainly for two reasons: one is posting and commenting on the analyses, answering comments and messages and, in general, interacting with the fans; the other is writing the code to perform new analyses, expand to other socials, and in general, all the work focused on the ‘vision’ I have for the future of the page.
- Could you please share the entire process of creating an analysis?
Sure. Around 30′ after the session, the data becomes available. I open the script related to the analyses I want to perform, update the session to be retrieved, and then run the script. The process, completely automated, saves the plots in a folder. I skim through the analyses to detect possible errors or problems and identify the most interesting analyses. Then, I start posting each one accompanied by my own comments.
- What is your advice to those who want to work or work in data analysis?
I’m not a data analyst and have never formally studied it, so I will give a practical answer. Find a project you’re passionate about, and use that to learn how to code and analyse the data. Even better is to include such a project in your study curriculum, so you will advance your studies as well while doing so.
- Let’s talk a little bit about Formula 1… When you look at the tests and the first race data this season, what is your power ranking and why?
Red Bull is the clear favourite for the season. Ferrari is the car with the second highest potential. Still, it was hampered by reliability problems, setup issues, and defective components (the single pylon rear wing) in Bahrain. Yet, if not for Leclerc’s retirement, it would have scored the 2nd most points as a constructor in Bahrain. The Aston Martin is an excellent car, also because the team is making it work as intended. It will be mighty if Ferrari and Mercedes continue to struggle with their problems. If these are solved, I see Ferrari being faster on average than the Aston, and Mercedes to be competing with them. However, the Aston proved to generate a lot of downforce and will be very strong on the slower tracks.
- Do you negotiate with Formula 1 teams? Do they ever need your data?
I’m not officially in contact with any F1 teams, but I know that the engineers of some of them love to discuss my analyses. I think they do because each team is very focused on their own car, so comparing the properties of all the vehicles is refreshing and exciting for them.
- What are your plans and dreams for this career in the future?
For my primary career, I plan to work in a field where my analytical and strategic skills can be used to the maximum. Concerning the page, I aim to keep growing and see where that leads me! Many people support the page monthly: one year ago, I would not have thought such a thing was possible. It is a powerful driver of dedication to the project.
- Istanbul Park is one of the cult tracks of Formula 1… What do you think about racing in Turkey and keeping it on the calendar?
I love the track, and I know that most fans do. The track is an incredible combination of fast corners, making these high-downforce monsters shine. Its presence in the calendar should be mandatory.
- Finally, what would you like to say to Formula 1 lovers and those working on data analysis in Turkey?
Firstly, I am terribly sad about the terrible earthquake that hit the country. The love of Formula 1 can distract some of the fans from its consequences, and it can be a catalyst for union and joy. Data Analysis is a field with no boundaries regarding its applications and geography. Most of these jobs can be performed remotely, so it has never been a better time to become a data analyst!
- First of all, thank you very much for your wishes and then for your sincere replies. We will always support and follow you.
Formula 1 Data Analisti Mirco Bartolozzi ile söyleşi
Formula 1 takip edenlerin en sevdiği data analiz sayfası “F1DataAnalysis”in kurucusu Mirco Bartolozzi, Medyascope Spor’dan Muhammed Kaya’nın sorularını cevapladı. Data analizi nedir, işe nereden başlamak gerekir, istatistik bilimindeki devrimler neler? Tüm cevapları röportajımızda bulabilirsiniz.
Mirco Bartolozzi ile söyleşi
Formula 1’de veri analizi başarıya giden yolu döşeyen önemli bir parçası. Formula 1 araçları bu verilerin doğru olarak okunması ile tasarlanır. Bu verilerin sağlıklı bir şekilde alınması ve okunabilir hale getirilmesi de veri analistlerinin ana görevi.
Formula 1’in veri analizi alanında dünyaca ünlü isimlerden biri olan sevgili Mirco Bartolozzi (sizlerin bildiği hesabın adı ile @F1DataAnalysis) ile keyifli bir söyleşi gerçekleştirdik.
Medyascope'u destekle. Medyascope'a abone ol.
Medyascope’u senin desteğin ayakta tutuyor. Hiçbir patronun, siyasi çıkarın güdümünde değiliz; hangi haberi yapacağımıza biz karar veriyoruz. Tıklanma uğruna değil, kamu yararına çalışıyoruz. Bağımsız gazeteciliğin sürmesi, sitenin açık kalması ve herkesin doğru bilgiye erişebilmesi senin desteğinle mümkün.
- Mirco, sizi tanımakla başlamak istiyorum… Kimdir Mirco Bartolozzi?
Merhabalar! Öncelikle, projemle ilgilendiğiniz için teşekkür ederim. 27 yaşında İtalyan bir mühendisim, şu anda motosiklet dinamiğine odaklanan bir doktora programının üçüncü ve son yılındayım. Cisimlerin hareketini ve hareketlerin nedenlerini irdeleyen fizik dalı olan mekaniğe her zaman tutkuluydum. Bu aşk, araç dinamiğine olan ilgime dönüştü ve beni makine mühendisliği eğitimime yöneltti.
Lisanstan sonra aynı alanda kara taşıtlarına odaklanarak yüksek lisansa devam ettim. Lisansımın son senesinden itibaren bir senedir üniversitemin Formula SAE takımının Süspansiyon ve Dinamik bölümünün bir üyesiyim. Sonradan daire başkanlığına terfi ettim; burada iki yıl boyunca aracın tasarımı, yapımı, montajı ve kurulumundan sorumluydum. Şu anda, yarışmada başarıyı yakalamak için öğrencilere rehberlik eden takımın danışılan bir süpervizörüyüm. Yüksek lisanstan sonra, özellikle manevra kabiliyeti, sürücü-araç etkileşimi ve yanal dinamiklere odaklanarak motosiklet dinamiklerini araştırdığım bir doktora programına devam etmeye karar verdim.
- Formula 1 ile tanışma hikayeni öğrenmek istiyorum… Ne zamandan beri izliyorsun?
Çocukken, büyükbabam büyük bir Ferrari hayranı olduğu için bazı Formula 1 yarışlarını izlediğimi hatırlıyorum O dönemlerde yarışları düzenli bir şekilde takip edemedim. Yarışları sıralamalardan itibaren izlediğim ilk sezon 2010 yılıydı. Bir Ferrari taraftarı olarak, Alonso’nun Petrov’u geçememesinin hayal kırıklığını hala hatırlıyorum. O yıldan sonra her sezonu yakından takip ettim. Özellikle çalışmalarım bu sporla iç içe olmaya başladıkça ve izleyerek daha fazla deneyim kazandıkça sporu her geçen yıl daha iyi anladığımı anımsıyorum.
- Bildiğim kadarı ile veri analizi üzerine çalışıyorsun… Bunları bizim için detaylandırır mısın?
Veri analisti olmamama rağmen, çalışmalarımda ve güncel araştırmalarımda her zaman verilerle çalıştım: simülasyonlardan elde edilen veriler veya gerçek araçlardan elde edilen deneysel veriler gibi. İşim, tanımlaması gereken gerçekliğin basitleştirilmiş temsilleri olan modeller yaratmayı özellikle içeriyor.
Temel olarak bir dizi denklem olan bir modele sahip olduğunuzda, modelin parametrelerini belirlemek için verileri kullanabilirsiniz: örneğin, iki araba aslında aynı şeydir, ancak her birinin kütle, güç ve kavrama gibi farklı parametreleri olacaktır. Araştırmalarımda, verilerde gördüklerime dayanarak varsayımlarda bulunuyorum ardından sonuçlarımı geliştirmek/doğrulamak için verileri kullanıyorum.
- Peki, Formula 1’in verileri üzerine çalışma fikri nasıl doğdu? Bildiğim kadarı ile profesyonel düzeyde, değil mi?
Lisans ve yüksek lisans döneminde hafta sonları da dahil her zaman çok çalıştım, bu yüzden doktora yapmaya başladığımda çok fazla boş zamanımın olmasını garipsedim. O zamanın bir kısmını, ben dahil insanların ilginç bulacağına inandığım bir şey için kullanmaya karar verdim: bu, sadece bir yıl sonra sosyal medyada yaklaşık 140.000 kişinin takip etmesinden de görebileceğiniz gibi, çok beğenildi.
Tek tip bir analize ayıracağım zaman, bilimsel bir makaleye ayıracağımdan çok daha az ancak, analizi ortaya çıkardığımda verileri en açık ve kapsamlı şekilde sunmak için elimden gelenin en iyisini yapıyorum. Özellikle derinlemesine bilgilerle dolu analizler yapmak ve bu bilgileri dolu dolu bir şekilde sunmak hem profesyonel mühendisler hem de sıradan hayranlar tarafından takdir edilmenin anahtarı oldu.
- Önceki soru ile bağlantılı olarak… Verileri ortaya çıkarırken hangi programları kullanıyorsun? Çok zamanını alıyor mu?
Verileri çıkarmak için “FastF1 Python” paketini kullanıyorum. Bu aylarda, doğru pilotları ve turları seçmekten; sonuçları çizmeye ve depolamaya kadar analiz oluşturma sürecinin çoğunu otomatikleştirdim. Ancak, bu projeyi yönetmek çok zamanımı alıyor. Başlıca iki nedenden dolayı, ilki analizleri yayımlamak ve yorumlamak; yorumları ve mesajları yanıtlamak ve genel olarak takip edenlerle etkileşim kurmak; diğeri ise yeni analizler yapmak, diğer sosyal ağlara genişlemek ve genel olarak sayfanın geleceği için sahip olduğum “vizyona” odaklanan tüm çalışmaları yapmak için kod yazmak.
- Baştan sona bir analizi oluşturma sürecini öğrenebilir miyiz?
Elbette. Seans bittikten yaklaşık 30 dakika sonra veriler kullanılabilir hale gelir. Yapmak istediğim analizlerle ilgili scripti açıp, veri alınacak seansı güncelliyorum ve ardından scripti çalıştırıyorum. Tamamen otomatik olan süreç, çizimleri bir klasöre kaydediyor. Olası hataları veya sorunları tespit etmek ve en ilgi çekici analizleri belirlemek için analizleri detaylıca incelerim. Ardından her birini kendi yorumlarımla birlikte yayınlamaya başlarım.
- Veri analizinde çalışan veya çalışmak isteyenlere tavsiyelerin nelerdir?
Ben bir veri analisti değilim ve resmi olarak hiç çalışmadım, bu yüzden genel geçer bir cevap vereceğim. Tutkulu olduğunuz bir proje bulun, bunu verileri kodlamayı ve analiz etmeyi öğrenmek için kullanın. Daha da iyisi, böyle bir projeyi çalışma müfredatınıza dahil etmektir, böylece bunu yaparken çalışmalarınızı da ilerletmiş olursunuz.
- Dönelim sevdiğimiz konuya… Formula 1’de testler ve ilk yarışın verileri ışığında takımların güç sıralamasını nedenleri ile öğrenebilir miyim?
Red Bull sezonun açık ara favorisi. Ferrari ise en yüksek potansiyele sahip ikinci araç. Yine de Bahreyn’deki dayanıklılık sorunları, kurulum sorunları ve kusurlu bileşenler (tek parçalı arka kanat) nedeniyle düşük performanslı kaldı. Yine de Leclerc yarış dışı kalmasaydı, Bahreyn’de takım olarak Red Bull’un ardından en fazla puanı toplayacaktı. Aston Martin’in aracı mükemmel çünkü ekip onu amaçlandığı gibi çalıştırıyor. Ferrari ve Mercedes sorunlarıyla boğuşmaya devam ederse daha da güçlü olacak. Bunlar çözülürse, Ferrari’nin Aston’dan daha hızlı olduğunu ve Mercedes’in onlarla rekabet edebileceğini görüyorum. Bununla birlikte, Aston Martin çok fazla yere basma kuvveti ürettiğini kanıtladı ve daha yavaş pistlerde çok güçlü olacaklar.
- Formula 1 takımlarıyla temasların oluyor mu? Verilerine ihtiyaç duydukları oldu mu?
Resmi olarak herhangi bir Formula 1 takımıyla iletişim halinde değilim, ancak bazı takımların mühendislerinin analizlerimi tartıştığını ve bunları sevdiğini biliyorum. Bence iyi oluyor çünkü her takım kendi aracına odaklanıyor, bu yüzden tüm araçların özelliklerini karşılaştırmak onlar için tetikleyici ve heyecan verici.
- Gelecekle ilgili kariyerinde ne gibi planların ve hayallerin var?
Ana kariyerim olan akademik kariyerim için, analitik ve stratejik becerilerimi maksimize edebileceğim bir alanda çalışmayı planlıyorum. Sayfayla ilgili olarak ise büyümeye devam etmeyi ve bunun beni nereye götüreceğini görmeyi hedefliyorum! Birçok kişi sayfayı aylık olarak maddi ve manevi destekliyor. Bir yıl önce böyle bir şeyin mümkün olduğunu düşünmezdim bu durum projeye kendimi adamam için önemli bir itici güç.
- İstanbul Park Formula 1’de kült pistlerden biri bildiğin üzere… Türkiye’de yarışın olması ve sürekli olarak takvimde kalması ile ilgili ne düşünüyorsun?
Pisti kesinlikle seviyorum ve çoğu spor severin sevdiğini de biliyorum. Pist, hızlı virajların inanılmaz bir kombinasyonu ve bu yüksek yere basma kuvveti üreten canavar araçları parlatır. Takvimde bulunması gereken pistlerden.
- Son olarak… Türkiye’de bulunan Formula 1 takipçilerine ve Formula 1 verileri ile ilgilenenlere ne söylemek istersin?
Öncelikle, ülkenizi vuran korkunç deprem için çok üzgünüm. Formula 1 sevgisi, bazı taraftarları bu yıkıcı sonuçlarından uzaklaştırabilir; belki birlik ve neşe için bir katalizör olabilir. Veri Analizi, uygulamaları ve coğrafyası itibariyle sınırları olmayan bir alandır. Bu işlerin çoğu uzaktan gerçekleştirilebilir, bu nedenle veri analisti olmak için hiç bu kadar iyi bir zaman olmamıştı!
- Öncelikle dileklerin için sonrasında samimi cevapların için çok teşekkür ederiz. Seni hep destekliyor ve takip ediyor olacağız.
Muhabir: Muhammed Kaya
Editörler: Leo Kendrick & Doğa Üründül