stdray: (Default)
[personal profile] stdray
[personal profile] xeno_by написал, что макры для скалы почти вот-вот будут готовы. А люди как-то не очень радуются. Я почитал комментарии, мне что-то не понравилось такое обсуждение.


Макросы - это признание поражения. "Наш язык оказался недостаточно хорошо, нам придется генерировать программы на нём, чтобы продолжать притворяться, что мы пишем на нём".

Во-первых, тут явно подразумевается, что кодогенерация является чем-то плохим и доказывает несостоятельность языка, как средства для написания программ. Из моего ежедневного: редактировать форму мне удобней в графическом дизайнере, просматривать схему базы данных и редактировать связи между таблицами опять же удобней в графическом представлении. По-моему, очевидно, что если существуют разные способы выполнить одну работу, то надо выбирать самый удобный. И либо у нас есть серебряная пуля, либо для каждой задачи существует свой самый удобный инструмент. А чтобы это все как-то между собой взаимодействовало о совмещалось, надо приводить к одному знаменателю. Например, к текстовому представлению в виде кода на определенном языке программирования. Этот способ не единственный, но, на мой взгляд, достаточно практичный и удобный.
Во-вторых, языки развиваются и видоизменяются. При этом во время компиляции многие известные мне языки сначала рассахариваются в некоторое подмножество языковых конструкцию, после чего код на этом подможестве преобразуется в AST и поехало. Специальный синтаксис для монад (linq query syntax в C#, do-нотация в Haskell), asyc/await в C#, сахар для стрелок в том же Haskell, препроцессоры OCaml и множество других примеров. Интересно, нормально ли после каждого релиза с подобными изменениями, упрекать авторов в том, что их язык оказался недостаточно хорош?

В-третьих, существуют расширения компилятора. Для Haskell'а они активно используются и даже можно встретить мнения, что часть этих расширений пора включить в стандарт. Для C# делается некий проект Roslyn, который должен позволить пилить аналогичным образом расширения для главного языка дотнетов. На мой взгляд, это свидетельсво того факта, что разные люди по-разному видят развитие инструмента и работают в соответствующем направлении. Расширение его возможностей или наоборот специализация - это нормально. Но можно, например, заявить про признание поражения.

На мой взгляд, имеет место быть "ваша пуля не серебряная", а это как-то не серьезно.


Код с макросами очень трудно отлаживать.

Этот пойт я не понял. Я пишу на Немерле, и код с использованием макросов в отладке ни чем не отличается от кода без них. Откуда могут быть проблемы? Было выражение, потом на этапе компиляции оно раскрылось в другое выражение. И итоге получается простой линейный код с нормальными именами переменных. Проблемы - это когда стираются имена аргументов, когда стейт шарится между кучей объектов, когда стектрейс растягивается на два экрана, когда куча всего вычисляется лениво и ошибки этих вычислений экранируются и игнорируются или пихаются в стейт, когда все это вычисляется в нескольких потоках наступает ад. Макросы ничего в этот список не привносят. Есть еще отладка самих макросов, но это дело скорее неудобное чем сложное, по крайней мере, применительно к Немерле.


Практически деткам в руки дали не спички, а сразу тротиловые шашки. Представляю, что на этом могут построить наши индийские братья по разуму.

Во-первых, всем всем равно, чем занимается контингент именуемый здесь "индийские братья по разуму". Сколько лет я программирую, столько лет слышу эти рассказы, иногда вижу какие-то подтверждения. Если человек склонен к превращению кода в ад, он это сделает. Они этим занимались на Lisp, занимались на Си, занимаются на Java, будут заниматься на любом другом языке. (Я считаю, что в той или иной мере мы все к этому склонны, просто не всегда рядом есть кто-то, способный увидеть сумасшествие и указать на это, как и не всегда есть желание обсуждать подобное. А вопрос как раз и состоит в постоянном развитии и совершенствовании. И приоритеты в этом развитии могут быть разными).

Во-вторых, я не вижу, чтобы слабые программисты лезли использовать мощные и сложные средства. То есть существует некий контингент постоянно стремящийся интегрировать в проекты НОВЬЕ из последнего выпуска журнала Хакер или статей на Хабре, но там либо старшие товарищи останавливают, либо все желание пропадает, пока новатор разбирается с новой игрушкой. А те программисты, которые ничем не интересуются, пишут на небольшом примитивных подмножестве языка, мирно делаю свои велосипеды и никому жизнь портить не пытаются. (Всегда забавляет эта ежемесячная статья на Хабре "Что такое атрибуты в дотнете и зачем они нужны" и куча комментариев вроде "интересно, спасибо, прочитал") А макросы в статически типизируемом языке с негомоиконичным синтаксисом - штука сложна, очень сложная. И вроде, [personal profile] xeno_by говорил, мол Мартин считает, что макросы и должны быть сложными. Может по каким-то таким причинам.


Скала очень сложная и без макросов.

- Ребята, я конфетки вам принес
- Не надо, у нас уже есть БАГЕТ. Очень сытный


То есть, я каким-то серьезных аргументов против макросов в Скале пока не увидел. Не хотят люди пользоваться - никто не заставляет. Не знают, какие задачи будут решаться макросами - но ведь никто и не спрашивает. Да и часто не читают про эти самые макросы, то у там С++, то сишка, то рефлексия тормозит.

(no subject)

Date: 2012-11-08 01:50 am (UTC)
From: [identity profile] golikov konstantine (from livejournal.com)
>вот начнут компилировать в нативный код

так уже же

есть scala под llvm, его конечно надо потыкать палочкой что бы убедится что оно живое, но как proof-of-concept вполне годится

(no subject)

Date: 2012-11-08 09:26 am (UTC)
From: [identity profile] thesz.livejournal.com
Этого мало самого по себе. Надо, чтобы накладные расходы на значения были в районе одного слова.

А то компилирующаяся в машинный код Scala будет иметь все минусы - и большие накладные расходы, и трудности с библиотеками.

(no subject)

Date: 2012-11-08 10:08 am (UTC)
From: [identity profile] sassa-nf.livejournal.com
я эту линию дискуссии не понимаю. В итоге вся скала компилируется JITом в машинный код. Беда в том, что JIT не силён в разворачивании обёрток, в которые вычисления завёрнуты.

Ленивые значения в Хаскеле как считать - одно значение в районе одного слова или это thunk в районе одного слова+одно значение?

(no subject)

Date: 2012-11-08 11:29 am (UTC)
From: [identity profile] thesz.livejournal.com
Вот пример (я его уже неоднократно приводил).

http://hackage.haskell.org/packages/archive/containers/0.1.0.1/doc/html/src/Data-IntSet.html#IntSet

Значение с конструктором Tip займет два слова. Значение с конструктором Bin займёт 5 слов. Bin, как легко понять, вдвое меньше, чем Tip. В среднем, получится 3.5 слов на значение. В Java не получится лучше, чем 4,5 слов на значение.

Сколько слов займут эти два конструктора в Скале?

(no subject)

Date: 2012-11-08 01:08 pm (UTC)
From: [identity profile] sassa-nf.livejournal.com
А как вы расчитываете количество слов на значение в джаве?

Не вижу, почему бы скале быть в этом случае хуже, чем в джаве.

  case class IntSet;
  case class Nil extends IntSet;
  case class Tip(v:Int) extends IntSet;
  case class Bin(prefix:Int, mask:Int, left:IntSet, right:IntSet) extends IntSet;

генерирует ничего особенного:
Compiled from "a.scala"
public class a$Bin extends a$IntSet implements scala.ScalaObject,scala.Product,scala.Serializable {
  private final int prefix;

  private final int mask;

  private final a$IntSet left;

  private final a$IntSet right;
...(больше никаких полей не объявлено)
Compiled from "a.scala"
public class a$Tip extends a$IntSet implements scala.ScalaObject,scala.Product,scala.Serializable {
  private final int v;
...(больше никаких полей не объявлено)

(no subject)

Date: 2012-11-08 01:25 pm (UTC)
From: [identity profile] thesz.livejournal.com
http://www.javamex.com/tutorials/memory/object_memory_usage.shtml

8 байтов накладных расходов.

http://stackoverflow.com/questions/7060141/what-determines-java-object-size

И это ещё в лучшем случае!

Кстати, я неправильно посчитал расход памяти для Java для полноценного дерева. В случае Java будет 1 дополнительное слово для Bin и два дополнительных слова для Tip. Это приведёт к дополнительным расходам в 1,5 слова на значение. То есть, 5 слов супротив 3,5 на Хаскеле.

(no subject)

Date: 2012-11-08 01:48 pm (UTC)
From: [identity profile] sassa-nf.livejournal.com
ну, так дело не пойдёт :)

в джаве расход на object header и паддинг полей является implementation specific: IBM JVM на хедер тратит 4 байта, а хотспот 8. В количество памяти на объект также нужно учесть фрагментацию памяти, а это вообще архитектурно-зависимо. В том же хотспоте размер объекта нужно округлить вверх до кратного 8 байтам. При наследовании хотспот поля каждого уровня наследования тоже паддит. Примитивные значения сгруппированы отдельно от указателей. volatile поля выровнены до границы машинного слова. На 64-битных машинах указатели часто 32-битные, зато тратится лишние 2% ЦПУ на конвертацию обратно в 64-битные. Это всё не из-за того, что не могли сделать по-другому в принципе, а потому, что такие design decisions позволяют выиграть какие-то проценты на производительности кэша и GC.

Я думаю, гораздо более интересным сравнением будет глубина применения каких-нибудь unwrap . wrap = id оптимизаций, умение обращаться с мелкими transient объектами. Вот тут Джава может облажаться из-за трудностей escape analysis; до какой-то степени делается, но есть свои но.

(no subject)

Date: 2012-11-08 01:57 pm (UTC)
From: [identity profile] thesz.livejournal.com
Что это всё означает? Это означает, что в лучшем случае вы сможете получить такой же расход по памяти, как и Хаскель.

И да, pragma RULES в Скале невозможна.

(no subject)

Date: 2012-11-08 02:39 pm (UTC)
From: [identity profile] sassa-nf.livejournal.com
гм. я думал, это всё означает, что когда расход памяти такой же, как у Хаскеля, то это ещё не означает, что это лучший вариант даже у Хаскеля.

А ещё, я думал, это всё означает также, что расход памяти на один объект - это не так важно, как важен расход памяти на единицу бизнес логики. Как один простой пример, если уметь выбросить не нужные unwrap . wrap, которые присутствуют в коде, вы избавитесь от объектов. Второй пример - если суметь reuse место от immutable объектов до GC, опять, избавитесь от объектов.

Например, будет ясно, что тупли Скалы будут соответствовать объектам, которые Джава не сможет распаковать и потому не сможет пользоваться чисто unboxed значениями. Вот если в силу особенностей построения программы на Хаскеле компилятор может делать более глубокий анализ таких паттернов и создавать меньше объектов, чем java, это будет гораздо более ощутимой выгодой, потому что оптимизация создания одного лишнего объекта перекрывает оверхеды от разницы в размерах сразу нескольких объектов меджу этими платформами. Тем более, что чем крупнее объект, тем меньше % эта самая разница, верно?

(no subject)

Date: 2012-11-08 02:46 pm (UTC)
From: [identity profile] thesz.livejournal.com
>и создавать меньше объектов,

Вы про дизайн ByteString читывали ли? А ещё есть short cut deforestation. И та же pragma RULES.

(no subject)

Date: 2012-11-08 02:58 pm (UTC)
From: [identity profile] sassa-nf.livejournal.com
нет, не читал. А что за short cut deforestation?

заметьте, я не говорю, что кто-то круче кого-то. :) я лишь пытаюсь направить обсуждение на более интересную метрику. И привожу примеры с unwrap . wrap только потому, что это что-то, о чём я читал, но сколько из этого происходит на практике я ж не знаю :) вот в джаве - знаю, что unbox+box на бумаге-то есть, но совершенно не следует умение оптимизировать сколь угодно сложные формы boxing или сколь угодно вложенные boxing.

(no subject)

Date: 2012-11-08 03:03 pm (UTC)
From: [identity profile] thesz.livejournal.com
deforestation - избавление от промежуточных данных. AFAIK, полноценно возможно в ограниченных случаях. short cut deforestation - избавление от промежуточных данных в виде элементов списка.

(no subject)

Date: 2012-11-08 03:23 pm (UTC)
From: [identity profile] sassa-nf.livejournal.com
о, short cut deforestation нагуглился. that's what i am talking about :) вот такие вот вещи круче, чем футпринт отдельно взятых объектов.

(no subject)

Date: 2012-11-08 04:00 pm (UTC)
From: [identity profile] thesz.livejournal.com
Я ещё подразню.

Суперкомпиляция: http://research.microsoft.com/en-us/um/people/simonpj/papers/supercompilation/

Включает в себя inline, deforestation (насколько возможно), склеивание циклов и, наверное, многое другое.

Проверка контрактов: http://gallium.inria.fr/~naxu/research/HaskellContract.pdf

Типа проверка test_Sort = all $ (\xs -> zipWith (<=) xs (tail xs)) $ sort xs на этапе компиляции.

(no subject)

Date: 2012-11-08 04:10 pm (UTC)
From: [identity profile] sassa-nf.livejournal.com
о, склеивание циклов :) а я боялся спросить.

December 2019

S M T W T F S
1234567
891011121314
15161718192021
222324252627 28
293031    

Most Popular Tags

Style Credit

Expand Cut Tags

No cut tags