Телеграмм чат группы ctodailychat страница 6992

parrot.ru

Рейтинг популярных групп и каналов

В рейтинге участвует:

групп:

каналов:

Виртуальный сервер на SSD - недорого!

Аренда выделенных и виртуальных серверов (VDS/VPS), хостинг, аренда IP-адресов, администрирование, круглосуточная поддержка

qwarta.ru подробнее

Резервное копирование с проверкой на вирусы!!!

Удобный сервис создания резервных копий на любой сервер сети интернет. Отслеживайте изменения, проверяйте на вирусы. Надежно защитите свой бизнес!

go.backupland.com

Выбираете сервер? Любая конфигурация на заказ!

Аренда физических серверов любых конфигураций под любые запросы - 1С бухгалтерия, игровые сервера, нагруженные проекты, интернет-магазины!

qwarta.ru подробнее

Size: a a a

ctodailychat

1392 membersпожаловаться на группу

2020 November 13

AS

Alexey Shcherbak in ctodailychat

Если так поразмышлять над темой - идея прикольная, такой pagerank программистов на основании опен-сорс проектов в которых они наконтрибьтили когда-то... Возможно стоит спросить у тех же ребят из гугла - что они использовали для строительства своего pagerank. Ибо данных у вас ожидается много, на ГХ 100М репок было еще в 2018.

источник

04:29пожаловаться #1

SB

Sam Becket in ctodailychat

Alexey Shcherbak

Если хотите ускорить поиск - можно сделать блум фильтр и пофильтровать, отсеяв большинство запросов, которые вернут пустой результат (вообще не искать с сразу сказать - вы хотите "10x unicorn, вы никого не найдете с такими параметрами") а дальше уже построить какую либо систему для каскадного сужения поиска (если это ключевая проблема).

не, с этим все в порядке (кажется), пока проблем с пустыми результатами нет, т.к. если гитхаб ничего по запросу не нашел, то и мы ничего не получили

источник

04:30пожаловаться #2

AS

Alexey Shcherbak in ctodailychat

Красиво, возможно потом продаться гитхабу\МС

источник

04:30пожаловаться #3

SB

Sam Becket in ctodailychat

Alexey Shcherbak

Если так поразмышлять над темой - идея прикольная, такой pagerank программистов на основании опен-сорс проектов в которых они наконтрибьтили когда-то... Возможно стоит спросить у тех же ребят из гугла - что они использовали для строительства своего pagerank. Ибо данных у вас ожидается много, на ГХ 100М репок было еще в 2018.

хз, я спрашивал, посоветовали sourcegraph это то, что нужно ¯\_(ツ)_/¯

источник

04:31пожаловаться #4

SB

Sam Becket in ctodailychat

Alexey Shcherbak

Красиво, возможно потом продаться гитхабу\МС

Я так и хочу! :)

источник

04:31пожаловаться #5

AS

Alexey Shcherbak in ctodailychat

не, с этим все в порядке (кажется), пока проблем с пустыми результатами нет, т.к. если гитхаб ничего по запросу не нашел, то и мы ничего не получили

но вызов к API использовали...

источник

04:31пожаловаться #6

SB

Sam Becket in ctodailychat

На это первоначально целились

источник

04:31пожаловаться #7

AS

Alexey Shcherbak in ctodailychat

хз, я спрашивал, посоветовали sourcegraph это то, что нужно ¯\_(ツ)_/¯

возможно или я не понимаю как тут сг поможет или люди его советовавшие - не совсем поняли масштабы...

источник

04:32пожаловаться #8

AS

Alexey Shcherbak in ctodailychat

А какой был совет в плане применения СГ - по тому как я вижу что делает СГ и где гитхаб - это только "выкачайте себе гитхаб и ищите по нему" ?

источник

04:33пожаловаться #9

SB

Sam Becket in ctodailychat

Alexey Shcherbak

возможно или я не понимаю как тут сг поможет или люди его советовавшие - не совсем поняли масштабы...

возможно и так 😅

если честно не знаю, что делать, кроме как поднять инвестиций и сделать собственный dependency graph, или договориться с гитхабом на пилот

источник

04:33пожаловаться #10

SB

Sam Becket in ctodailychat

Alexey Shcherbak

но вызов к API использовали...

да, допустим поиск по 3м библиотекам, значит 3 вызова, но ключевая проблема не в этом!! :D

Проблема в том, что результаты пагинированы, их может быть до 100 на странице, и гитхаб не отдает свыше кажется первых трех страниц поиска

соответственно по 2м зависимостям можно максимум найти 100*n*2
где n - количество максимальных страниц с результатами, которые мы можем получить

источник

04:39пожаловаться #11

AS

Alexey Shcherbak in ctodailychat

На это первоначально целились

это основная идея, для того чтобы это продавать как сервис - очень узкая ниша, т.к. поиск по опенсорсу - сильно ограничен (это как если бы на работу нанимали только тех у кого есть вебсайт и его можно найти гуглом). Это такой компонент для ГХ для привлечения внимания к себе, не только как "эй, мы гигантское хранилище кода "разного качества" ", но с такой фичей ГХ может сказать а смотрите, как мы умеем еще и в рекрутмент\поиск талантов.
Но тут есть пара моментов
- у МС уже есть LinkedIn, и там это вполне денежно, если они еще сами соединят ЛИ с ГХ - это будет сильный заход.
- у ГХ много сильных ребят, а идея в целом на поверхности (кмк) - они или сами ее уже пилят (А если нет - можно хорошо наняться в ГХ) или попробовали но поняли что коммерчески - не выгодно или данные низкого качества.

источник

04:41пожаловаться #12

AS

Alexey Shcherbak in ctodailychat

да, допустим поиск по 3м библиотекам, значит 3 вызова, но ключевая проблема не в этом!! :D

Проблема в том, что результаты пагинированы, их может быть до 100 на странице, и гитхаб не отдает свыше кажется первых трех страниц поиска

соответственно по 2м зависимостям можно максимум найти 100*n*2
где n - количество максимальных страниц с результатами, которые мы можем получить

ну такую проблему СГ решить может, но для этого вам надо выкачать все репки перед тем как по ним искать, а у ГХ они уже есть. тут имхо не в пагинации дело а в том - где взять данные чтобы по ним чем-то искать, но вам виднее.

источник

04:43пожаловаться #13

SB

Sam Becket in ctodailychat

Alexey Shcherbak

это основная идея, для того чтобы это продавать как сервис - очень узкая ниша, т.к. поиск по опенсорсу - сильно ограничен (это как если бы на работу нанимали только тех у кого есть вебсайт и его можно найти гуглом). Это такой компонент для ГХ для привлечения внимания к себе, не только как "эй, мы гигантское хранилище кода "разного качества" ", но с такой фичей ГХ может сказать а смотрите, как мы умеем еще и в рекрутмент\поиск талантов.
Но тут есть пара моментов
- у МС уже есть LinkedIn, и там это вполне денежно, если они еще сами соединят ЛИ с ГХ - это будет сильный заход.
- у ГХ много сильных ребят, а идея в целом на поверхности (кмк) - они или сами ее уже пилят (А если нет - можно хорошо наняться в ГХ) или попробовали но поняли что коммерчески - не выгодно или данные низкого качества.

А мы не только по opensource ищем

источник

04:44пожаловаться #14

SB

Sam Becket in ctodailychat

Мы можем и по закрытым искать

источник

04:44пожаловаться #15

SB

Sam Becket in ctodailychat

Во первых та лютая убер-вафля (Github dependency graph) парсит в том числе и по закрытым исходникам

Во-вторых, мы честно предлагаем, каждому авторизовавшемуся программисту дать доступ к своим dependencies файлам, для того, что бы мы могли наиболее релевантно определить их опыт (без доступа к самом коду разумеется)

источник

04:46пожаловаться #16

AS

Alexey Shcherbak in ctodailychat

По закрытым - где и как ? ну т.е. простой момент - я работал в компании Х с технологией Y, там все было в своем тенанте гитхаба - вы эту инфу не вытащите если компания X не поделится с вами историей гита. А она не поделится. И гитхаб не даст поиск в закрытые корп репки...

источник

04:46пожаловаться #17

AS

Alexey Shcherbak in ctodailychat

Во первых та лютая убер-вафля (Github dependency graph) парсит в том числе и по закрытым исходникам

Во-вторых, мы честно предлагаем, каждому авторизовавшемуся программисту дать доступ к своим dependencies файлам, для того, что бы мы могли наиболее релевантно определить их опыт (без доступа к самом коду разумеется)

ой, за такое можно по шапке получить от конторы, ибо ты даешь доступ к IP компании которым ты не владеешь.

источник

04:47пожаловаться #18

AS

Alexey Shcherbak in ctodailychat

я имею ввиду за "второе"

источник

04:48пожаловаться #19

SB

Sam Becket in ctodailychat

Alexey Shcherbak

это основная идея, для того чтобы это продавать как сервис - очень узкая ниша, т.к. поиск по опенсорсу - сильно ограничен (это как если бы на работу нанимали только тех у кого есть вебсайт и его можно найти гуглом). Это такой компонент для ГХ для привлечения внимания к себе, не только как "эй, мы гигантское хранилище кода "разного качества" ", но с такой фичей ГХ может сказать а смотрите, как мы умеем еще и в рекрутмент\поиск талантов.
Но тут есть пара моментов
- у МС уже есть LinkedIn, и там это вполне денежно, если они еще сами соединят ЛИ с ГХ - это будет сильный заход.
- у ГХ много сильных ребят, а идея в целом на поверхности (кмк) - они или сами ее уже пилят (А если нет - можно хорошо наняться в ГХ) или попробовали но поняли что коммерчески - не выгодно или данные низкого качества.

Они пробовали делать git jobs лет 5-10 назад, но не взлетело

не взлетело как раз таки по причине не релевантных офферов

что бы эффективно матчить компанию с программистом, который интересуется/работает в том же техническом стеке, что и ты — нужна технология dependency graph или её аналог

поэтому я собственно и хочу на этой теме зайти в гх и продаться им :)

источник

04:50пожаловаться #20