science и data scientists? А то гуглю, а мне какую-то расплывчатую фигню говорят.
тут опечатка, это не сайнс, а сатанизм - т.е вера в применение магических формул для достижения некоторого результата
Подождите-ка, а как же математика? Это ж вроде оттуда формулы
это легенда , с помощью которой шаманы обьясняют нубам , почему им надо верить.
Владимир вот вообще закончил кулинарный, а транспортную задачу вам запросто решит! А все почему? Потому что математика это миф
математика это не миф, но датасатанисты не занимаются математикой.
я только успею деньги считать, какая нахрен математика?
А чем тогда занимаются? А то везде пишут матан то, матан сё
я же выше написал
"Да"?
Просто ведь даже в вакансиях про это пишут. Зачем пишут, если этого в работе вообще не будет?
Вопрос к тем, кто пишет это в вакансиях)
Ну да, логично
Тогда можно про конкретные скиллы, которыми должен обладать датасатанист?
а примеры таких вакансий привидите?
Да нет таких, надо отталкиваться от конкретной вакансии
Ох, блин. То есть это не просто датасатанисты, там еще и подтипов куча?
Да вот только что зашел на indeed, написал "ml-engineer" в поиске, тыкнул на рандомную вакансию и там сразу матан
конечно, есть те что камлают на ЛЛМки, есть те кто мастера из экселевских табличек делать конфетку
во, уже применили первый приём датасатанизма - подмена понятий, аплодирую. Вместо datascience ищём ml-engineer
Так, падаждити! Я вот на сайте одном смотрел, пишут что это как бы подраздел датасатанизма
Это что же получается, врут, сволочи? И кто тогда ml-engineer?
я думаю это зависит от вашей юрисдикции, в некоторых местах человек не может зваться Engineer без нужной бумажки, а чтобы получить нужную бумажку надо сдать экзамен, а чтобы его сдать надо знать то-самое. А в других местах верят на-слово.
Может подскажете, в чем вообще датасатанизм заключается? И в какую сторону двигаться для изучения этого всего?
в обработке данных, дают тебе на входе данные, а на выходе ты должен дать другие данные, в соответсвии с требованием начальника (заказачика, и т.д)
Data scientists are professionals who analyze and interpret complex digital data to inform business decision-making. They use a combination of skills in statistics, mathematics, programming, and domain-specific knowledge to extract insights and knowledge from data. Here are some key tasks and responsibilities of data scientists: Data Collection: Gather and collect large sets of structured and unstructured data from various sources, which may include databases, APIs, logs, and external data sources. Data Cleaning and Preprocessing: Clean, process, and organize raw data into a format suitable for analysis. This may involve handling missing values, removing outliers, and transforming variables. Exploratory Data Analysis (EDA): Conduct exploratory data analysis to understand the patterns, relationships, and trends within the data. Visualization tools are often used to help communicate findings to non-technical stakeholders. Statistical Analysis and Modeling: Apply statistical techniques and machine learning algorithms to build predictive models or uncover insights. This could involve regression analysis, clustering, classification, or other methods depending on the nature of the problem. Feature Engineering: Identify and create relevant features (variables) that can improve the performance of machine learning models. Model Evaluation and Validation: Assess the performance of models using appropriate metrics, and ensure their validity and reliability. This often involves splitting the data into training and testing sets. Deployment of Models: Implement and deploy models into production environments, making them accessible for real-time decision-making. Communication of Results: Effectively communicate findings to both technical and non-technical stakeholders. This includes preparing reports, visualizations, and presentations to convey the insights derived from the data. Continuous Learning: Stay up-to-date with the latest developments in data science, machine learning, and relevant domain-specific knowledge. Ethical Considerations: Consider and address ethical issues related to data, such as privacy concerns and biases in the data and models. Data scientists may work in various industries, including finance, healthcare, e-commerce, and technology. They play a crucial role in helping organizations leverage their data to make informed decisions, improve processes, and gain a competitive advantage.
https://t.me/datasciencechat/262892
Ребят, вы меня запутали. Сначала говорили, что матан не нужен. Теперь вот присылаете текст, где прямо про матан говорится
Я же вам написал уже — нужно отталкиваться от того, куда вы планируете идти работать
Я сейчас попрошу ChatGPT перегенерировать ответ без матана, если хотите
Да это-то понятно. Смысле, как работа-то происходит? Не в экселе же все это делать?
Да ничего против матана не имею
есть люди , которые делают всё в экселе
По моим личным наблюдениям, если я открываю научную статью, а там excel или графики из него, то с огромной долей вероятности сама статья будет ни о чем
https://www.nature.com/articles/d41586-021-02211-4 - прикольно, оказывается все эти учёные писали статьи ни о чём.
Я же говорю, по моим наблюдениям, а это не генеральная совокупность, да и выборка нерепрезентативна, потому что в основном это из изучаемой предметной области. Но вот то, что я видел - это почти 90% было шлаком, да простят меня коллеги
а какой у вас n ?
Где-то 20-30, не больше, я их не сейвил в zotero (не из-за экселя, а просто из-за качества), не могу сказать точно
В защиту shit-а могу сказать, что парочку из них точно были написаны в форме научрук + студент (видимо, для дипломов), поэтому особых претензий к этим не имею, а другие не смотрел
а научрук + студент - это ни о чём, по умолчанию?
Нет, возможно студенту это просто не нужно, а ему нужен диплом, но требуют статью, поэтому на скорую руку
Это статистика на стероидах
На собесе на джуна спросят почти наверное
во, как раз по рассылки пришла вакансия datascience , требования: Education / Experience PhD/MS degree in statistics, informatics or related field, PhD : Experience preferred’ MS Degree: 4+ years of related experience with applied problems, Ability to write code in SQL, R, and Python for processing large datasets in distributed cloud environments, and experience in processing and analyzing healthcare data, particularly in HL7 formats, Experience developing, evaluating, and implementing machine learning models, Experience working with clinicians and researchers across disciplines to develop approaches for use in clinical care, Experience working in cloud environments or working in a healthcare organization, Graduate level understanding of techniques in machine learning, knowledge representation, and artificial intelligence along with a strong understanding of statistics, Knowledge of software development, machine learning, and technology infrastructure, Excellent verbal and written communication skills, strong interpersonal skills, along with demonstrated creativity and latitude in problem solving, including the ability to prioritize and execute multiple competing tasks.
Ну так можно устроиться в другое место, где не требуется PHD/MS, и потом, на практике, устраиваться на такие же позиции, просто козырнув опытом
Обсуждают сегодня