215 похожих чатов

Господа, у меня вопрос. Что вообще такое этот ваш data

science и data scientists? А то гуглю, а мне какую-то расплывчатую фигню говорят.

44 ответов

153 просмотра

тут опечатка, это не сайнс, а сатанизм - т.е вера в применение магических формул для достижения некоторого результата

Inkosta- Автор вопроса
Vladimir F
тут опечатка, это не сайнс, а сатанизм - т.е вера ...

Подождите-ка, а как же математика? Это ж вроде оттуда формулы

Inkosta
Подождите-ка, а как же математика? Это ж вроде отт...

это легенда , с помощью которой шаманы обьясняют нубам , почему им надо верить.

Inkosta
Подождите-ка, а как же математика? Это ж вроде отт...

Владимир вот вообще закончил кулинарный, а транспортную задачу вам запросто решит! А все почему? Потому что математика это миф

Elmo
Владимир вот вообще закончил кулинарный, а транспо...

математика это не миф, но датасатанисты не занимаются математикой.

Vladimir F
математика это не миф, но датасатанисты не занимаю...

я только успею деньги считать, какая нахрен математика?

Inkosta- Автор вопроса
Vladimir F
математика это не миф, но датасатанисты не занимаю...

А чем тогда занимаются? А то везде пишут матан то, матан сё

Inkosta- Автор вопроса
Inkosta- Автор вопроса
Vladimir F
математика это не миф, но датасатанисты не занимаю...

Просто ведь даже в вакансиях про это пишут. Зачем пишут, если этого в работе вообще не будет?

Inkosta
Просто ведь даже в вакансиях про это пишут. Зачем ...

Вопрос к тем, кто пишет это в вакансиях)

Inkosta- Автор вопроса
Inkosta- Автор вопроса
Eldar
Вопрос к тем, кто пишет это в вакансиях)

Тогда можно про конкретные скиллы, которыми должен обладать датасатанист?

Inkosta
Тогда можно про конкретные скиллы, которыми должен...

Да нет таких, надо отталкиваться от конкретной вакансии

Inkosta- Автор вопроса

Ох, блин. То есть это не просто датасатанисты, там еще и подтипов куча?

Inkosta- Автор вопроса
Vladimir F
а примеры таких вакансий привидите?

Да вот только что зашел на indeed, написал "ml-engineer" в поиске, тыкнул на рандомную вакансию и там сразу матан

Inkosta
Ох, блин. То есть это не просто датасатанисты, там...

конечно, есть те что камлают на ЛЛМки, есть те кто мастера из экселевских табличек делать конфетку

Inkosta
Да вот только что зашел на indeed, написал "ml-eng...

во, уже применили первый приём датасатанизма - подмена понятий, аплодирую. Вместо datascience ищём ml-engineer

Inkosta- Автор вопроса
Vladimir F
конечно, есть те что камлают на ЛЛМки, есть те кто...

Так, падаждити! Я вот на сайте одном смотрел, пишут что это как бы подраздел датасатанизма

Inkosta- Автор вопроса
Vladimir F
конечно, есть те что камлают на ЛЛМки, есть те кто...

Это что же получается, врут, сволочи? И кто тогда ml-engineer?

Inkosta
Это что же получается, врут, сволочи? И кто тогда ...

я думаю это зависит от вашей юрисдикции, в некоторых местах человек не может зваться Engineer без нужной бумажки, а чтобы получить нужную бумажку надо сдать экзамен, а чтобы его сдать надо знать то-самое. А в других местах верят на-слово.

Inkosta- Автор вопроса
Vladimir F
я думаю это зависит от вашей юрисдикции, в некотор...

Может подскажете, в чем вообще датасатанизм заключается? И в какую сторону двигаться для изучения этого всего?

в обработке данных, дают тебе на входе данные, а на выходе ты должен дать другие данные, в соответсвии с требованием начальника (заказачика, и т.д)

Data scientists are professionals who analyze and interpret complex digital data to inform business decision-making. They use a combination of skills in statistics, mathematics, programming, and domain-specific knowledge to extract insights and knowledge from data. Here are some key tasks and responsibilities of data scientists: Data Collection: Gather and collect large sets of structured and unstructured data from various sources, which may include databases, APIs, logs, and external data sources. Data Cleaning and Preprocessing: Clean, process, and organize raw data into a format suitable for analysis. This may involve handling missing values, removing outliers, and transforming variables. Exploratory Data Analysis (EDA): Conduct exploratory data analysis to understand the patterns, relationships, and trends within the data. Visualization tools are often used to help communicate findings to non-technical stakeholders. Statistical Analysis and Modeling: Apply statistical techniques and machine learning algorithms to build predictive models or uncover insights. This could involve regression analysis, clustering, classification, or other methods depending on the nature of the problem. Feature Engineering: Identify and create relevant features (variables) that can improve the performance of machine learning models. Model Evaluation and Validation: Assess the performance of models using appropriate metrics, and ensure their validity and reliability. This often involves splitting the data into training and testing sets. Deployment of Models: Implement and deploy models into production environments, making them accessible for real-time decision-making. Communication of Results: Effectively communicate findings to both technical and non-technical stakeholders. This includes preparing reports, visualizations, and presentations to convey the insights derived from the data. Continuous Learning: Stay up-to-date with the latest developments in data science, machine learning, and relevant domain-specific knowledge. Ethical Considerations: Consider and address ethical issues related to data, such as privacy concerns and biases in the data and models. Data scientists may work in various industries, including finance, healthcare, e-commerce, and technology. They play a crucial role in helping organizations leverage their data to make informed decisions, improve processes, and gain a competitive advantage.

Inkosta- Автор вопроса
Eldar
Data scientists are professionals who analyze and ...

Ребят, вы меня запутали. Сначала говорили, что матан не нужен. Теперь вот присылаете текст, где прямо про матан говорится

Inkosta
Ребят, вы меня запутали. Сначала говорили, что мат...

Я же вам написал уже — нужно отталкиваться от того, куда вы планируете идти работать

Inkosta
Ребят, вы меня запутали. Сначала говорили, что мат...

Я сейчас попрошу ChatGPT перегенерировать ответ без матана, если хотите

Inkosta- Автор вопроса
Vladimir F
в обработке данных, дают тебе на входе данные, а ...

Да это-то понятно. Смысле, как работа-то происходит? Не в экселе же все это делать?

Inkosta- Автор вопроса
Inkosta
Да это-то понятно. Смысле, как работа-то происходи...

есть люди , которые делают всё в экселе

Vladimir F
есть люди , которые делают всё в экселе

По моим личным наблюдениям, если я открываю научную статью, а там excel или графики из него, то с огромной долей вероятности сама статья будет ни о чем

Kim Young
По моим личным наблюдениям, если я открываю научну...

https://www.nature.com/articles/d41586-021-02211-4 - прикольно, оказывается все эти учёные писали статьи ни о чём.

Vladimir F
https://www.nature.com/articles/d41586-021-02211-4...

Я же говорю, по моим наблюдениям, а это не генеральная совокупность, да и выборка нерепрезентативна, потому что в основном это из изучаемой предметной области. Но вот то, что я видел - это почти 90% было шлаком, да простят меня коллеги

Vladimir F
а какой у вас n ?

Где-то 20-30, не больше, я их не сейвил в zotero (не из-за экселя, а просто из-за качества), не могу сказать точно

Vladimir F
а какой у вас n ?

В защиту shit-а могу сказать, что парочку из них точно были написаны в форме научрук + студент (видимо, для дипломов), поэтому особых претензий к этим не имею, а другие не смотрел

Kim Young
В защиту shit-а могу сказать, что парочку из них т...

а научрук + студент - это ни о чём, по умолчанию?

Vladimir F
а научрук + студент - это ни о чём, по умолчанию?

Нет, возможно студенту это просто не нужно, а ему нужен диплом, но требуют статью, поэтому на скорую руку

Это статистика на стероидах

Inkosta
Ребят, вы меня запутали. Сначала говорили, что мат...

На собесе на джуна спросят почти наверное

Inkosta
Ребят, вы меня запутали. Сначала говорили, что мат...

во, как раз по рассылки пришла вакансия datascience , требования: Education / Experience PhD/MS degree in statistics, informatics or related field, PhD : Experience preferred’ MS Degree: 4+ years of related experience with applied problems, Ability to write code in SQL, R, and Python for processing large datasets in distributed cloud environments, and experience in processing and analyzing healthcare data, particularly in HL7 formats, Experience developing, evaluating, and implementing machine learning models, Experience working with clinicians and researchers across disciplines to develop approaches for use in clinical care, Experience working in cloud environments or working in a healthcare organization, Graduate level understanding of techniques in machine learning, knowledge representation, and artificial intelligence along with a strong understanding of statistics, Knowledge of software development, machine learning, and technology infrastructure, Excellent verbal and written communication skills, strong interpersonal skills, along with demonstrated creativity and latitude in problem solving, including the ability to prioritize and execute multiple competing tasks.

Vladimir F
во, как раз по рассылки пришла вакансия datascienc...

Ну так можно устроиться в другое место, где не требуется PHD/MS, и потом, на практике, устраиваться на такие же позиции, просто козырнув опытом

Похожие вопросы

Обсуждают сегодня

Господа, а что сейчас вообще с рынком труда на делфи происходит? Какова ситуация?
Rꙮman Yankꙮvsky
29
А вообще, что может смущать в самой Julia - бы сказал, что нет единого стандартного подхода по многим моментам, поэтому многое выглядит как "хаки" и произвол. Короче говоря, с...
Viktor G.
2
30500 за редактор? )
Владимир
47
а через ESC-код ?
Alexey Kulakov
29
Чёт не понял, я ж правильной функцией воспользовался чтобы вывести отладочную информацию? но что-то она не ловится
notme
18
У меня есть функция где происходит это: write_bit(buffer, 1); write_bit(buffer, 0); write_bit(buffer, 1); write_bit(buffer, 1); write_bit(buffer, 1); w...
~
14
Добрый день! Скажите пожалуйста, а какие программы вы бы рекомендовали написать для того, чтобы научиться управлять памятью? Можно написать динамический массив, можно связный ...
Филипп
7
Недавно Google Project Zero нашёл багу в SQLite с помощью LLM, о чём достаточно было шумно в определённых интернетах, которые сопровождались рассказами, что скоро всех "ибешни...
Alex Sherbakov
5
Ребят в СИ можно реализовать ООП?
Николай
33
https://github.com/erlang/otp/blob/OTP-27.1/lib/kernel/src/logger_h_common.erl#L174 https://github.com/erlang/otp/blob/OTP-27.1/lib/kernel/src/logger_olp.erl#L76 15 лет назад...
Maksim Lapshin
20
Карта сайта