Size: a a a

Технологии, медиа и общество

2019 July 25
Технологии, медиа и общество
Насколько анонимной будет ваша анкета, если убрать из неё только ваше имя? Много ли в вашем квартале живёт людей вашего пола, родившихся в один день с вами?

Британские исследователи обработали несколько сотен датасетов, в том числе из переписи населения США, и создали матмодель, оценивающую вероятность точной идентификации человека по его неполным персональным данным. Гражданина США можно идентифицировать по почтовому индексу, полу и дате рождения с точностью 81%. 15 демографических характеристик дают 99,98% шанс на точную деанонимизацию. Вот здесь вы сами можете добавлять в комбинацию разные данные и смотреть, как это влияет на точность идентификации.

Удаление строки с именем пользователя ещё не делает базу с персональными данными безопасной. Как показывает эта работа, любой анонимизированный датасет с личной информацией можно считать таким лишь условно.

И ещё раз посоветую вам прочитать историю о том, как ничего не подозревающих пользователей деанонимизировали по купленным на чёрном рынке историям посещений браузера.
источник
2019 July 26
Технологии, медиа и общество
​​Галактика Daily Mail. Как работает дистрибуция контента в медиа

За последние полтора года многое в моем понимании механизмов дистрибуции контента поменялось, и вот наконец все это достигло некой критической массы внутри и смогло превратиться в очень важный для меня лонгрид. В нем примерно все, что я знаю о дистрибуции медиа на сегодняшний день.
источник
Технологии, медиа и общество
источник
2019 July 27
Технологии, медиа и общество
источник
2019 July 29
Технологии, медиа и общество
Недавно в Open AI создали настолько качественный генератор текстов, что решили не публиковать его исходный код. Машинный копирайтинг можно использовать во вред обществу — например, для наполнения новостных сайтов фейками в промышленных масштабах.

Но у машинных текстов есть одна слабость. Текстовые генераторы основаны на статистических моделях, и поэтому редко выдают неожиданные последовательности слов. Исследователи из Гарварда создали модель, тестирующую текст на "предсказуемость". Программа анализирует последовательности слов в тексте и подсвечивает их разными цветами, в зависимости от того, насколько ожидаемым является слово с учётом предыдущих.

A word that ranks within the most likely words is highlighted in green (top 10), yellow (top 100), red (top 1,000), and the rest of the words in purple. Thus, we can get a direct visual indication of how likely each word was under the model.

Таким образом легко обнаружить машинные тексты: в них много зеленых и желтых слов и очень мало красных. В живых, человеческих текстах наоборот, много красных и пурпурных слов. Во время теста студенты смогли самостоятельно обнаружить машинные тексты лишь в 50% случаев. С программой этот показатель вырос до 72%. Можете протестировать модель сами.

Что ещё почитать по теме:

• Как машины генерируют тексты: четыре основных подхода
• Как научить нейросеть генерировать политические тексты, потратив всего $8
• Форум, где общаются нейросети, обученные на комментариях и постах с Reddit
источник
2019 July 30
Технологии, медиа и общество
Только за одно утро WeChat узнаёт, когда пользователь просыпается, с кем переписывается, о чём говорит, какие банковские данные использует, по какому адресу живёт, какой кофе пьёт и как выглядит. И это уже не говоря о том, как и сколько платит за жильё, телефон, метро и прочие бытовые вещи.

Каково жить в Китае с приложением, которое знает о тебе всё — перевод материала Nautilus:

https://vc.ru/social/76530-wechat-sledit-za-toboy via @tjournal
источник
Технологии, медиа и общество
Исследование канадских правозащитников из CitizenLab рассказывает, как WeChat цензурирует частные беседы пользователей.

Цензуре подвергаются публичные ленты пользователей и и частные беседы. Причём в частных беседах применяется цензура в реальном времени.

У приложения есть база хэшей запрещенных картинок (хэш — уникальная последовательность символов, в которую изображение преобразовывается по специальному алгоритму; сравнивать хэши проще, чем графические файлы — это просто текст). Хэш каждой загружаемой в чат картинки сравнивается с хэшами запрещённых картинок. Если вы пытаетесь отправить другу запрещённое изображение, оно не будет доставлено получателю. При этом ни адресат, ни отправитель не получат оповещения о цензуре.

Даже если картинка проходит проверку хэша, она автоматически анализируется на содержание. Алгоритмы распознавания текста проверяют, не является ли изображение скриншотом запрещенного текста или другой модификацией запрещенных материалов. Раньше цензуру обходили незначительными изменениями вроде поворота изображения, сейчас алгоритмы стали умнее.

Нежелательный для властей контент — всё, что касается чувствительных вопросов внешней и внутренней политики — удаляется из чатов и добавляется в общую базу запрещенных материалов. Среди последних громких тем, попавших под цензуру — скандал вокруг китайского учёного, отредактировавшего геном детей, торговый конфликт с США, исчезновение из Верховного суда важных документов, касающихся многомиллиардного спора горнодобывающих компаний, и коррупционные скандалы.
источник
2019 July 31
Технологии, медиа и общество
​​Интересная информация к размышлению о цифровом суверенитете. Oracle — один из крупнейших производителей enterprise софта (базы данных, облачные системы и т.п.). Проанализировав данные своих систем, компания опубликовала несколько инсайтов о китайском интернете.

1. В большинстве стран нормальная практика — наличие иностранных телеком-операторов, которые обеспечивают обмен трафиком с внешним миром. В Китае не работают зарубежные телеком-операторы. Вместо этого китайские провайдеры соединяются с внешним интернетом через точки обмена в США и Западной Европе. Сетевая периферия китайского интернета вынесена за границы страны.

2. Во многих странах внутренний трафик может проходить через зарубежные серверы. К примеру, в Канаде 45% внутренних подключений проходят через американские серверы. Инфраструктура российского интернета менее зависима от внешних серверов — 25% подключений проходят через Швецию, 71% — обрабатываются внутри страны. Китай и здесь стоит особняком — 100% внутренних соединений обрабатываются внутри страны.

Фактически китайский интернет — это интранет, огромная локальная сеть. Он независим от иностранных телеком-операторов, а весь китайский трафик проходит только через китайские серверы. Грубо говоря, Китай может отключиться от мирового интернета — и учитывая, что все нужные пользователям сервисы есть в самом Китае, на внутреннем китайском интернете это никак не отобразится.
источник
Технологии, медиа и общество
Кстати, вот отличный проект Quartz о том, как устроен интернет. Подводные кабели, сети доставки контента, контроль государств над интернетом, международный трафик, спутниковый интернет, датацентры, балканизация интернета, провайдеры и карта интернета — всего 11 историй. Есть даже история о том, как каучук помог произвести революцию в телекоммуникациях (из него начали делать покрытие для кабелей).

Бонус: подробный рассказ о подводной инфраструктуре интернета. Много текста и фотографий, есть перевод.
источник
2019 August 01
Технологии, медиа и общество
Протест уровень "киберпанк"

В Гонконге с 9 июня длятся протесты, во время которых и представителями правопорядка, и протестующими применяются системы распознавания лиц.

Сотрудники таким образом пытаются распознать участников протеста. При этом сами снимают идентификационные номера с униформ.

Недавно задержан возможный администратор Telegram-канала @Dadfindboy, на котором деанонили(разоблачали) полицейских разгоняющих протест.

В результате противодействия, протестующие нашли способ борьбы с системой распознавания лиц.

Они направляют на них мощные лазеры, чтобы "ослепить" камеры. В деле это показано на приложенном видео.

#новость
источник
2019 August 02
Технологии, медиа и общество
В Гонконге продолжаются продемократические протесты: их участники недовольны влиянием Китая на политику автономной территории. BBC рассказывает, как приложения помогают сделать протест анонимным.

Протестующие координируют свои действия через анонимные каналы и группы в Telegram. В каналах сообщают новости, ведут прямые репортажи с протестов и предупреждают протестующих о действиях полиции. Крупнейшие каналы набирают до 70 000 подписчиков — это 1% населения Гонконга.

В отдельных группах протестующим предоставляют помощь юристы, медики и группы первой помощи.

В некоторых случаях участники определяют дальнейшее развитие протеста с помощью голосования — к примеру, продолжать вечером осаду полицейского офиса или расходиться по домам.

Плакаты с анонсами дальнейших протестов распространяют через Airdrop.

Чтобы уменьшить цифровой след, участники протестов используют наличку и не пользуются банкоматами во время акций. Самые осторожные каждый раз используют для связи новую SIM-карту и простые мобильники.

Также активисты используют коллективные аккаунты — один человек может иметь доступ к 5-6 аккаунтам на разных устройствах. В то же время одним аккаунтом может управлять несколько человек.

Анонимные активисты собрали на краудфандинге более миллиона долларов на продвижение своей позиции в международных СМИ: они хотят, чтобы скандальный закон об экстрадиции из Гонконга обсудили на саммите G20.

После про-демократических протестов в 2014 году многих лидеров движения осудили. Это привело к ещё большему недоверию к властям. Никто не хочет попасть в тюрьму. Теперь координаторы протеста скрывают свою идентичность с помощью технологий, делая его "безлидерским".

Подробнее о причинах протестов (BBC)
источник
Технологии, медиа и общество
Чтобы улучшить работу Siri, Apple нанимает подрядчиков. Они слушают, что пользователь сказал голосовому ассистенту, и оценивают, корректно ли Siri отвечает, а также отмечают случайные активации и нестандартные запросы. Один из таких подрядчиков рассказал Guardian, что при этом сотрудники получают доступ к частным разговорам пользователей: contractors regularly hear confidential medical information, drug deals, and recordings of couples having sex, as part of their job providing quality control. These recordings are accompanied by user data showing location, contact details, and app data.

Apple заявляет, что для контроля качества анализируются менее 1% всех активаций Siri. Но даже это немало. У Apple — 35% рынка умных часов, а большая часть случайных активаций приходится как раз на Apple Watch и HomePod (умную колонку от Apple). При этом пользователи Siri не знают, что их разговоры могут слышать подрядчики Apple. И не могут отказаться от этой опции.

Что ещё почитать:
— Как подрядчики Amazon слушают разговоры пользователей Alexa
— Как дипломированные лингвисты работают в потогонке, чтобы вы могли пользоваться Google Assistant
— Как Apple использует дешевый труд подрядчиков для работы своих сервисов
Почему стартапы скрывают за чатботами живых операторов
Почему распознавание речи — такая сложная задача
Смогут ли машины распознавать речь так же, как люди?
— Разные казусы с голосовыми помощниками: они становятся объектами харрасмента, учат детей плохим манерам, свидетельствуют против своих владельцев, отправляют записи их разговоров случайным людям и всё время подслушивают 👂🏻
источник
Технологии, медиа и общество
Китайские инженеры показали беспилотный велосипед, который реагирует на голосовые команды. Устройство сохраняет равновесие на неровной поверхности, ловко поворачивает и может следовать за человеком во время пробежки.

В самой идее нет ничего нового – в теории, оснастить двухколесный транспорт таким же функционалом могут многие производители.

Фишка в использовании нейроморфного чипа Tianjic – ИИ-процессора, который обрабатывает информацию, подражая человеческому мозгу. Велосипед одновременно учится и сразу же выполняет команды. Чтобы продемонстрировать результат, ему не нужно тренироваться часами.

В производстве традиционных микрочипов Китай не преуспел – индустрия отстает как минимум на пять лет. Догонять западных конкурентов уже нет смысла – нужно искать альтернативу. Ей могут стать ИИ-чипы, которые нужны робомобилям, камерам слежения и дронам.

В перспективе микроэлетроника нового типа поможет алгоритмам быстрее обучаться и работать эффективнее. Роботы и беспилотники научатся ориентироваться на местности, а для тренировки систем распознавания голоса и изображений не придется привлекать команду низкооплачиваемых фрилансеров – ИИ будет обучаться сам.

В случае с велосипедом, если устройство сможет самостоятельно “думать”, оно будет расходовать энергию более эффективно, а запас хода увеличится.

*Главное об устройстве нового ИИ-чипа Tianjic
*ИИ-чипы как новая надежда китайской индустрии
*Дефицит копеечных конденсаторов угрожает всему hardware-рынку
источник
2019 August 03
Технологии, медиа и общество
🔥 40 тысяч читателей! Ура!

Когда я завёл этот канал в начале 2016 года, я просто тестировал новую платформу и рассчитывал, что меня будут читать несколько сотен друзей из других соцсетей. А в итоге собрал здесь огромную и очень качественную аудиторию. Ценю ваше внимание и всегда делюсь с вами только тем, что мне самому кажется интересным и помогает лучше понимать безумный современный мир.

Напоминаю, что у меня есть ещё один канал — личный блог, где я делюсь всем, что показалось мне интересным (сложно объяснить, о чём он, просто пролистайте несколько десятков постов). Welcome: https://t.me/brodetsky_2.

Спасибо, что читаете!
источник
2019 August 04
Технологии, медиа и общество
Нейросеть может генерировать музыку, изображения, видео — для неё это просто наборы данных. Программа обрабатывает тысячи этих наборов, находит в них закономерности и генерирует новые наборы, которые следуют тем же закономерностям. В данные можно преобразовать что угодно — и этому посвящён проект How to Generate (Almost) Anything. В нём люди создают в сотрудничестве с машинами новую музыку, кулинарные рецепты, предметы одежды, парфюмы, граффити, пьесы, видеофейки, ювелирные украшения и даже вирусы. Посмотрите, это очень интересно. Именно так будет выглядеть проникновение машин в креативный процесс. ИИ не заменяет, а дополняет творческий подход и экспертизу человека.
источник
Технологии, медиа и общество
​​Теперь, когда все душные диды отписались, начнём.

Статья, которая лежит в заметках уже две недели. Выжимка из книги «The Culture Map» о культурных различиях разных стран. Как человек, выросший в закрытом монокультурном обществе, которое срало на всех вокруг и даже себя, я люблю собирать такие вот инсайды как видят мир другие люди. Не знаю зачем. В парадигме «америкосов, фашистов и грязных папуасов» как-то проще было. Не читайте.

«The Culture Map» — книга, которую я буду давать каждому, кто переезжает заграницу. Прочитай я её лет пять назад, когда она вышла, сэкономил бы себе кучу ошибок.

https://vc.ru/hr/77152-kulturnaya-karta-klyuchevye-idei-bestsellera-karta-kulturnyh-razlichiy-erin-meyer
источник
2019 August 05
Технологии, медиа и общество
Хороший текст, почитайте.

Инвестор и ученый Кай-Фу Ли — один из самых влиятельных экспертов в области ИИ. Его книга «Сверхдержавы искусственного интеллекта» — рассказ о борьбе Кремниевой долины и Китая за лидерство в сфере искусственного интеллекта. В одной из глав автор рисует антиутопическую картину: развитие технологий приведет к неравенству между нациями.

https://ideanomics.ru/articles/18471
источник
2019 August 06
Технологии, медиа и общество
Подобно технологиям и промышленности, ИИ естественным образом тяготеет к монополии. Он совершенствуется, получая новые данные, и это создает замкнутый цикл: чем лучше продукт, тем больше пользователей, чем больше пользователей, тем больше данных, а чем больше данных, тем лучше продукт. Когда какая-то компания вырывается вперед, этот цикл может быстро сделать дистанцию между ней и конкурентами непреодолимой.

Все семь гигантов искусственного интеллекта и подавляющее большинство лучших инженеров в области ИИ уже сосредоточены в США и Китае. Они строят огромные хранилища данных, питающие разнообразные продукты, такие как самоуправляемые автомобили, автономные дроны, устройства для перевода с иностранных языков и для распознавания лиц, программы для восприятия и синтеза естественного языка и многое другое. Чем больше данных эти компании накапливают, тем труднее будет компаниям из других стран конкурировать с ними.

По мере того как ИИ простирает свои щупальца во все отрасли экономики, эти технологические сверхдержавы будут получать все новые преимущества. По оценкам PwC, Соединенные Штаты и Китай намерены получить как минимум 70% от 15,7 трлн долларов, которыми ИИ обогатит мировую экономику к 2030 году, причем на долю Китая придется 7 трлн. Другим государствам останется подбирать остатки, в то время как сверхдержавы ИИ будут наращивать производительность труда внутри страны и получать потоки прибыли из всех стран земного шара.


Лучшая иллюстрация к этому — список самых дорогих интернет-компаний мира. Тотальное доминирование двух сверхдержав.
источник
Технологии, медиа и общество
Китайский киберпанк: мужчина покупает билет, обманывая приложение с биометрической оплатой с помощью искусственной головы 🤯
источник
2019 August 07
Технологии, медиа и общество
Интернет-компании, собирающие данные о посещениях пользователей, трекают вас даже на порносайтах. Упс 😳

Our analysis of 22,484 pornography websites indicated that 93% leak user data to a third party. Tracking on these sites is highly concentrated by a handful of major companies, which we identify. We successfully extracted privacy policies for 3,856 sites, 17% of the total. The policies were written such that one might need a two-year college education to understand them. Our content analysis of the sample's domains indicated 44.97% of them expose or suggest a specific gender/sexual identity or interest likely to be linked to the user.

Tracking sex: The implications of widespread sexual data leakage and tracking on porn websites
источник